一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

缺失测井曲线预测方法及装置与流程

2022-07-10 07:44:10 来源:中国专利 TAG:


1.本发明涉及碳酸盐岩、火山岩、泥页岩等复杂岩性储层的测井曲线预测技术领域,尤其涉及缺失测井曲线预测方法及装置。


背景技术:

2.本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
3.测井是油气勘探开发的重要技术手段,通过对测量获得的井下声学、放射性、电学等岩石地球物理特性曲线数据进行处理分析,可以实现对油气层的定性识别和参数定量计算,并为油气藏综合评价提供关键数据支持。然而由于地下情况复杂,且在测量过程中存在井径扩大、仪器故障等各种难以预料且不可避免的问题,以及测井实施操作不当和考虑经济性因素等人为原因,实际应用中经常出现部分井段测井数据失真或缺失的情况,这些缺失的部分甚至整条测井曲线会给储层测井评价工作带来极大挑战,而曲线预测是解决这类问题的常用技术方法。
4.传统缺失测井曲线预测主要依赖各种测井数据间的内在联系直接进行,比如通过交会图、多元回归等方法确定待预测的曲线与一条或几条已知曲线的经验关系,但是由于地下情况复杂和非均质性较强,测井数据之间经常呈现极强的非线性关系,数据间的映射关系也极为复杂,实际应用效果较差。近年来随着机器学习方法在科学和工程领域的广泛应用,很多研究者也建议使用数据驱动方法来解决地质问题,例如利用支持向量机(svm)、模糊逻辑模型(flm)和人工神经网络(ann)等方法来进行测井曲线预测,但这些方法本质上构造的是一种点到点或深度序列之间的映射关系,没有考虑到用于建立预测模型的样本数据与待预测井之间在油气藏地质构造、地层岩性变化等的关联性与差异性,这与实际地质分析经验和地质学思想相违背,因此预测生成测井曲线的准确性较低。


技术实现要素:

5.本发明实施例提供一种缺失测井曲线预测方法,用以提高预测生成测井曲线的准确性,该方法包括:
6.获取研究区的测井曲线、层位数据、井位数据和地质信息,所述地质信息包括地质构造或沉积相或岩相古地理;
7.根据研究区的测井曲线齐全井段的预设待预测曲线与其它测井曲线之间的相关性,优选用于建立机器学习网络模型的测井曲线组合;
8.根据研究区的测井曲线、层位数据、井位数据和地质信息,确定用于机器学习模型训练的样本井数据的权重,所述样本井为研究区的测井曲线齐全井,样本井数据为样本井中不同深度位置的测井曲线值;
9.构建机器学习网络模型;
10.利用样本井数据对构建的机器学习网络模型进行训练和验证;
11.根据研究区中的待处理井的已知测井曲线,利用训练和验证后的机器机器学习网络模型进行缺失测井曲线预测,获得待处理井的缺失测井曲线。
12.本发明实施例还提供一种缺失测井曲线预测装置,用以提高预测生成测井曲线的准确性,该装置包括:
13.信息获取模块,用于获取研究区的测井曲线、层位数据、井位数据和地质信息,所述地质信息包括地质构造或沉积相或岩相古地理;
14.曲线组合优先模块,用于根据研究区的测井曲线齐全井段的预设待预测曲线与其它测井曲线之间的相关性,优选用于建立机器学习网络模型的测井曲线组合;
15.权重确定模块,用于根据研究区的测井曲线、层位数据、井位数据和地质信息,确定用于机器学习模型训练的样本井数据的权重,所述样本井为研究区的测井曲线齐全井,样本井数据为样本井中不同深度位置的测井曲线值;
16.机器学习网络模型构建模块,用于构建机器学习网络模型;
17.训练和验证模块,用于利用样本井数据对机器学习网络模型进行训练和验证;
18.预测模块,用于根据研究区中的待处理井的已知测井曲线,利用训练和验证后的机器机器学习网络模型进行缺失测井曲线预测,获得待处理井的缺失测井曲线。
19.本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述缺失测井曲线预测方法。
20.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述缺失测井曲线预测方法的计算机程序。
21.本发明实施例中,与现有技术相比,本发明提出了对用于建立测井曲线预测模型的样本数据集进行加权处理的方法,根据研究区的测井曲线、层位数据、井位数据和地质信息,确定用于机器学习模型训练的样本井数据的权重,从而增加训练样本井数据在预测模型训练中的贡献程度,显著提升了利用机器学习方法预测缺失曲线的精度。
附图说明
22.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
23.图1为本发明实施例中缺失测井曲线预测方法流程图;
24.图2为本发明实施例中更为详细的缺失测井曲线预测流程图;
25.图3为本发明实施例中lstm单元结构示意图;
26.图4为本发明实施例中五层lstm对应的数据信息传递过程图;
27.图5为本发明实施例中基于井距离的权重计算示意图;
28.图6为本发明实施例中基于地质属性的权重计算示意图;
29.图7为本发明实施例中利用本发明进行缺失曲线预测的效果图;
30.图8为本发明实施例中本发明方法与传统方法预测效果对比图;
31.图9为本发明实施例中缺失测井曲线预测装置结构框图。
具体实施方式
32.为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
33.为了实现上述目的,本发明提供了以下技术方案,如图1和图2所示:
34.步骤102:获取研究区的测井曲线、层位数据、井位数据和地质信息,所述地质信息包括地质构造或沉积相或岩相古地理。还可以包括岩心实验分析等资料。
35.具体的,测井曲线可以包括自然伽马、伽马能谱、电阻率、三孔隙度等测井系列;井位数据指工区各井的坐标,可用于确定各井位置和井之间的距离;层位数据指各井地质分层;地质构造/沉积相/岩相古地理指研究区通过地质研究绘制的地质构造图、各层系的沉积相图、岩性古地理图等;岩心实验分析数据可对本发明结果进行进一步验证。
36.步骤104:根据研究区的测井曲线齐全井段的预设待预测曲线与其它测井曲线之间的相关性,优选用于建立机器学习网络模型的测井曲线组合。
37.具体的,常用测井曲线包括声波时差(ac)、中子(cnl)、密度(den)、自然伽马(gr)、去铀伽马(cgr)、深电阻率(rd)、浅电阻率(rs)、光电吸咐截面指数(pe)等曲线,记为记待曲线为i1表示曲线次序(1≤i1≤n,n为测井曲线总条数),j1也表示曲线次序(1≤j1≤k1,k1为待预测曲线总条数)。
38.在测井曲线齐全的井段,假设任意xi和yj的皮尔逊相关系数相存在,则以ρ
ij
为元素的n
×
k1阶矩阵称为该维随机向量的相关矩阵,记作r,表示为:
[0039][0040]
其中,其中,和表示和变量的期望,d(xi)和d(yj)表示和变量的方差。
[0041]
通过相关矩阵中对应行列的相关系数即可对各测井曲线与待预测曲线之间的相关性进行直观定量评价,一般当相关系数表示两条曲线之间相关程度较低,当相关系数表示两条曲线之间相关程度中等,当相关系数表示两条曲线之间相关程度高。通过设定相关系数阈值,即可优选确定相关性高的测井组合进行各目标曲线的预测。可以设定相关系数阈值为0.3。
[0042]
步骤106:根据研究区的测井曲线、层位数据、井位数据和地质信息,确定用于机器学习模型训练的样本井数据的权重,所述样本井数据为优选的测井曲线组合。
[0043]
现有利用机器学习进行缺失曲线预测的方法主要从机器学习方法、网络结构方面开展,没有考虑到用于建立预测模型的样本数据与待预测井之间在油气藏地质构造、地层
岩性变化等的关联性与差异性,因而适用性有限,预测精度较低。本发明针对该问题提出了变训练样本权重的思路和方法,可选的,可利用以下方法一种或多种组合确定用于机器学习模型训练的各样本井中各数据点的权重。
[0044]
下面提到的样本井指的是研究区的测井曲线齐全井中的典型井,而样本井数据指的是样本井中不同深度位置的测井曲线值。
[0045]
待处理井是指测井曲线缺失的井。
[0046]
1)利用待处理井与样本井之间的距离确定各样本井数据点的权重。
[0047]
通常在一个油田区块中,通常情况话,井与井之间的距离反映了两口井之间的相似程度,特别是在构造相对不发育、沉积稳定的油田区域,两口井的距离越小,这两口井在相同地层的岩性、物性、含油气性差异越小。因此,在进行缺失曲线预测时,可将待处理井的邻井的样本数据设置为较大的权重,而与待处理井距离较远的样本井数据设置为较小的权重。设待处理井a井井位坐标为(x0,y0),b样本井井位坐标为(xb,yb),则b井的样本数据点在机器学习模型训练时,各样本数据点的权重系数统一设置为:
[0048][0049]
其中,w
db
是b井数据点的权重系数,0≤w
db
≤1;a、b为工区的权重值计算系数,一般设置a=1、b=0;lm为工区最大井距。
[0050]
在计算所有参与训练的样本井的权重系数wd后,即可将所有各样本井对应的所有的样本数据点的权重均设置为wd。
[0051]
2)利用待处理井与样本井的地质属性确定各样本井数据点的权重。
[0052]
在沉积稳定、构造变化不大的油田区块,井与井之间的距离通常能够代表其相似性,但是在沉积变化大、构造运动复杂的区块,即使两口井之间距离非常近,其地层特征、测井曲线响应特征也有可能发生显著的变化,其相似程度还受沉积相分布、区域构造的影响。因此,在进行缺失曲线预测时,可将与待处理井地质属性相近的样本数据设置为较大的权重,地质属性差异明显的样本数据设置为较小的权重。
[0053]
设区块某地层沉积相可划分为n类,首先在工区内不同沉积区各选择若干口典型井,每个沉积相区包括的典型井数量记为numi(其中i表示沉积相带的编号)。记待处理井所在的沉积相区为参考区,对比其它沉积相带各典型井与参考区典型井对应预设待预测目标曲线的平均相似性。其中,预设待预测目标曲线的平均相似性,在各个沉积相区优选典型井,预设待预测目标曲线在这些典型井中实际上是已有的,这里用这些井的这条曲线相似性系数来确定权重。两条曲线之间的相似性可通过动态时间规整(dynamic time warping,dtw)方法计算累计距离γ进行评价,累计距离γ越小,表明两条曲线相似度越高。
[0054]
记井与井之间的预设待预测目标曲线相似性为s,这里对累计距离γ取以e为底的幂函数的倒数作为相似性评价指标:
[0055]
s=e-γ

[0056]
则某沉积相带与参考区的平均相似性为:
[0057]
[0058]
其中,num
refer
表示参考区中典型井数量;numi表示某沉积相带中典型井的数量;s
lk
表示参考区中第l口井与某沉积相带中第k口井之间的相似性;表示某沉积相带与参考区的平均相似性;i表示沉积相带的编号;l、k为井编号。其中,s
lk
按照公式s=e-γ
计算。
[0059]
据此,可根据样本井某层所属的沉积相区设定其权重系数若样本井与待处理井属于相同的沉积相区,则wf=1。在计算所有参与训练的样本井某层的权重系数wf后,即可将所有各样本井某层系对应的所有的样本数据点的权重均设置为wf。
[0060]
地质构造或岩相古地理是类似的,也是根据待处理井所在区块作为参考区,确定参考区典型井和其它区块典型井的平均相似性。
[0061]
3)利用待处理井与样本井的曲线相似性确定各样本井数据点的权重。
[0062]
除了根据待处理井与样本井之间的距离、待处理井与样本井的地质属性关系外,还可以利用待处理井与样本井对应输入曲线组合的相似性确定各样本井数据点的权重。
[0063]
设根据步骤104确定的建立机器学习模型的输入测井曲线组合为xi′
,某样本a井输入测井曲线组合记为x
ai

,待处理井对应的测井曲线组合记为x
0i

。参照上述通过动态时间规整方法计算对应曲线在某层段的相似性记为si′
,则a井该层段的权重系数:
[0064][0065]
其中,ρi′
表示第i

条曲线的指定权重,根据步骤104中各测井曲线与待预测曲线之间的相关性系数给定;si′
为a井第i

条曲线与待处理井对应曲线的相似性;w
as
为确定的a井在该层段的权重系数;n为输入测井曲线组合的总数目。
[0066]
在计算所有参与训练的样本井的权重系数ws后,即可将所有各样本井对应层段的所有的样本数据点的权重均设置为ws。
[0067]
4)通过上述几种方法计算的权重组合确定各样本井数据点的权重
[0068]
设某井通过待处理井与样本井之间的距离确定的权重系数为wd,通过待处理井与样本井的地质属性确定的权重系数为wf,通过待处理井与样本井的曲线相似性确定的权重系数为ws,可根据一种或多种方法确定的权重系数组合确定最终该井对应样本数据点的权重系数wc:
[0069]
wc=(wd wf ws)/3。
[0070]
上述公式是三种都选择,若选择两种则相应的权重相加后除以2。
[0071]
步骤108:建立机器学习网络模型。
[0072]
具体的,常用机器学习模型包括线性回归、支持向量机(svm)、多层神经网络(mlp)等,其模型结构可表示为输入层、隐藏层及输出层。输入层负责接收信号,隐藏层负责对数据的分解与处理,最后的结果被整合到输出层。
[0073]
可选的,本发明采用长短期记忆网络(lstm)建立曲线预测模型,长短时记忆网络一种改进之后的循环神经网络,可以解决传统循环神经网络无法处理长距离的依赖的问题,适合于具有深度序列意义的测井曲线预测问题。
[0074]
模型采用7层网络结构,tensorflow搭建lstm模型,其中:
[0075]
第一层为输入层,用于样本点数据输入,数据结构为[batch_size,sequence_lenth,data_dim]的三维张量形式,其中batch_size是输入数据块数量的大小,其大小为总
样本点数量,sequence_lenth是每一个数据块包含的序列信息长度,其大小与输入的测井曲线的采样间隔有关,通常取10-80,输入测井曲线的采样间隔越大,sequence_lenth越小,data_dim是数据点的曲线维度,即步骤2中确定测井曲线组合包含的曲线数量。这样每个数据块实际上包含sequence_lenth
×
data_dim数据体,且每个数据块对应一个待预测曲线目标输出值y_output和一个目标权重weight_y。
[0076]
网络第二层到第六层为标准的lstm层,将根据堆叠循环神经网络原理进行更深层级的抽象。每个lstm单元如图3所示。如图4是五层lstm对应的数据信息传递过程。
[0077]
所述lstm单元的内部设置有若干门限,各个门的工作过程可以表示为下式:
[0078]
单元输入公式:z
t
=g(wz×
x
t
r
zyt-1
bz);
[0079]
输入门公式:i
t
=σ(wi×
x
t
riy
t-1
pie c
t-1
bi);
[0080]
遗忘门公式:f
t
=σ(wf×
x
t
rfy
t-1
pfe c
t-1
bf);
[0081]
神经元细胞状态公式:c
t
=i
t
e z
t
f
t
e c
t-1

[0082]
输出门公式:o
t
=σ(wox
t
r
oyt-1
poe c
t
bo);
[0083]
单元输出公式:y
t
=o
t
e h(c
t
)。
[0084]
其中,z
t
表示lstm单元输入模块,x
t
表示t时刻输入的特征数据,wz表示输入数据与输入模块之间的参数矩阵,y
t-1
和y
t
表是t-1和t时刻的输出(在实际中表示隐藏状态),g是lstm单元输入模块的激活函数,rz、ri、rf、ro表示隐藏单元的权重,表征了对上一个深度点预测结果的利用率;bz、bi、bf、bo均表示偏置参数,pi、pf、po,c
t-1
为t-1时刻记忆单元的向量值,c
t
为神经元细胞状态,i
t
、f
t
、o
t
分别为lstm神经网络某节点在t时刻输入门、遗忘门和输出门的激活向量值,wi表示输入模块与隐藏层细胞单元之间的参数矩阵,wf表示输入数据与遗忘模块细胞单元之间的参数矩阵,e表示两个向量之间对应的点乘。
[0085]
网络第七层为输出层,在隐藏层和输出层的每个单元都有许多输入,这些输入连接上一层神经元,直到输出层计算获得网络的预测值。
[0086]
步骤110:利用样本井数据对构建的机器学习网络模型进行训练和验证。
[0087]
具体的,由于测井原理、物理响应特征的差异,不同测井曲线量纲不同、响应值也差异较大,在对机器学习模型训练、测试和应用前应对参与模型运算的输入曲线进行归一化。归一化的目标区间为[0,1],转换的方法如下式所示:
[0088][0089]
其中,xi表示归一化前某曲线在某个深度点的值;x
i*
表示归一化后的值;x
max
、x
min
分别表示通过该条测井曲线在全井段响应的最大值和最小值。
[0090]
在完成数据归一化处理后,利用测井曲线齐全井段的样本数据对机器学习模型进行训练和验证。模型训练的过程实质上是利用某目标曲线的已知数据和其它测井曲线数据确定机器学习模型的参数(即建立目标曲线数据和其它测井曲线数据之间的对应关系),从而在缺失该测井曲线数据的情况下,实现利用其它测井曲线预测出合理的曲线结果。
[0091]
在模型训练过程中,可对待训练的数据随机提取一定百分比η用于验证模型的收敛程度(一般η=0.2)。对于神经网络模型,通常采用后向传播算法进行梯度更新,得到模型隐藏层及输出层中各个权重和偏置参数,使实际测定的目标曲线和模型预测的曲线差异达到最小,其目标函数可表示为:
[0092][0093]
其中,loss(y
pred
,y
data
)表示实际测定的目标曲线和模型预测的曲线差异的代价函数;y
pred
表示模型预测的曲线值;y
data
表示实际测定的目标曲线值,w
t
表示根据步骤106确定的各样本点的权重系数。
[0094]
通常,如果loss(y
pred
,y
data
)低于一定阈值,且不随训练次数增加而下降,那么认为模型收敛,此时获得的权重和偏置参数即可认为是模型训练得到的最优参数。
[0095]
模型验证阶段,利用对上述训练完成的模型权重和偏置参数,获得模型预测的目标曲线,然后与输入的实际测井曲线进行差异计算,当差异值在可接受的范围内,且变化趋势与训练阶段类似时,认为模型参数稳定,没有发生过拟合现象,可用于后续实际资料的预测和处理。
[0096]
步骤112:根据研究区中的待处理井的已知测井曲线,利用训练和验证后的机器机器学习网络模型进行缺失测井曲线预测,获得待处理井的缺失测井曲线。
[0097]
具体的,在待处理井段,利用训练完成的机器学习模型,获得预测的曲线结果。操作与步骤110模型验证阶段类似,此时已知其它测井曲线值,输入到训练完成的机器学习模型中,即可获得对应的目标曲线预测结果。需要注意的是,输入到机器学习模型中的测井曲线数据同样需要步骤110所述的归一化处理,模型输出的预测结果需要进行反归一化处理才能恢复到正常目标测井响应分布范围的预测曲线。反归一化处理公式如下式所述:
[0098][0099]
其中,为根据某目标曲线在某深度点根据机器学习模型输出的预测结果;y
max
、y
min
为步骤110中给定的该测井曲线最大响应值和最小响应值;为反归一化处理后恢复到正常测井响应分布范围的预测曲线值。
[0100]
实施例
[0101]
1、以大庆油田某区块页岩油储层利用常规测井曲线预测横波时差为例,该区块已有常规测井曲线包括声波纵波时差(ac)、中子(cnl)、密度(den)、自然伽马(gr)、深电阻率(rd)、浅电阻率(rs)等,待预测曲线为声波横波时差(dts)。
[0102]
2、根据该井段声波纵波时差(ac)、中子(cnl)、密度(den)、自然伽马(gr)、深电阻率(rd)、浅电阻率(rs)六条常规测井曲线以及有阵列声波测井资料的井处理获得的声波横波时差(dts),根据步骤104所述公式计算各曲线相关系数矩阵,如下表1所示:
[0103]
表1
[0104]
相关系数dtsac0.79cnl0.78gr0.4rs-0.38rd-0.42
den-0.52
[0105]
依据步骤104的描述,设定相关系数阈值为0.3,则从表中可见,声波纵波时差(ac)、中子(cnl)、自然伽马(gr)、深电阻率(rd)、浅电阻率(rs)、密度(den)六条曲线与声波横波时差(dts)的相关系数的绝对值分别为0.79、0.78、0.4、0.38、0.42、0.52,均大于相关系数阈值为0.3,则表明声波纵波时差(ac)、中子(cnl)、自然伽马(gr)、深电阻率(rd)、浅电阻率(rs)、密度(den)六条曲线与声波横波时差(dts)均具有较好的相关性。据此,优选由于预测声波横波时差(dts)的常规测井组合为声波纵波时差(ac)、中子(cnl)、自然伽马(gr)、深电阻率(rd)、浅电阻率(rs)、密度(den)六条曲线。
[0106]
3.确定用于机器学习模型训练的各样本井中各数据点的权重。
[0107]
1)利用待处理井与样本井之间的距离确定各样本井数据点的权重。
[0108]
如图5所示,是基于井距离的权重计算示意图,图5中a井为目标井,井位坐标为(18551675,3349782),b、c、d井为样本井,井位坐标分别为(18555039,3351527)、(18550893,3358441)、(18541819,3354836),取a=1,b=0,设定工区最大距离lm为20km,则根据步骤106中公式可得:
[0109][0110]wdc
=0.565;
[0111]wdd
=0.446;
[0112]
从而,可以设置样本井b井所有的样本数据点权重系数为0.811,c井所有的样本数据点权重系数为0.565,d井所有的样本数据点权重系数为0.446。
[0113]
2)利用待处理井与样本井的地质属性确定各样本井数据点的权重。
[0114]
如图6所示,是某区沉积相图,该区某地层沉积相可划分为浅湖、滨湖、分流间湾、辨状河四大类。设待处理井a位于辨状河相带,指定辨状河相带为参考相带,在该区带中选择典型井a1、a2、a3;在浅湖相带中选择典型井b1、b2、b3,在滨湖相带中选择典型井c1、c2,在分流间湾相带中选择典型井d1。对比上述b1、b2、b3、c1、c2、d1与a1、a2、a3井横波时差曲线(dts)在该地层的相似性。两条曲线之间的相似性可通过动态时间规整(dynamic time warping,dtw)方法计算累计距离γ进行评价。记井与井之间的某地层曲线相似性为s,这里对累计距离γ取以e为底的幂函数的倒数作为相似性评价指标。以b1和a1井在某地层横波时差曲线(dts)相似度计算为例,假定通过动态时间规整计算的累计距离γ=0.89,则两条曲线相似度:
[0115]sb1a1
=e-0.89
=0.41;
[0116]
类似的,可计算出b1、b2、b3与a1、a2、a3相似度为:
[0117]
[0118]
则浅湖相带与参考区带评价相似性为:
[0119][0120]
同理,可确定滨湖相带与参考区带评价相似性为分流间湾与参考区带评价相似性为
[0121]
据此,可对样本井在该层段的样本数据点的权重进行设置,如图6中b井,其井位位于浅湖相带,则可设定其权重系数为0.43,c井该层段的样本数据点的权重为0.67,d井该层段的样本数据点的权重为0.52。
[0122]
3)利用待处理井与样本井的曲线相似性确定各样本井数据点的权重。
[0123]
以大庆油田某区块为例,建立机器学习模型的输入测井曲线组合为声波纵波时差(ac)、中子(cnl)、自然伽马(gr)、深电阻率(rd)、浅电阻率(rs)、密度(den),参照上述通过动态时间规整方法计算b井各曲线与待处理井在某层段的相似性分别为s
ac
=0.83、s
cnl
=0.66、s
gr
=0.81、s
rd
=0.76、s
rs
=0.75、s
den
=0.61,则b井该层段的权重系数:
[0124]wbs
=(0.79
×
0.83 0.78
×
0.66 0.4
×
0.81 0.38
×
0.76 0.42
×
0.75 0.52
×
0.61)/6=0.43
[0125]
同理,可对其它样本井各曲线与待处理井在某层段的相似性计算后确定其数据点的权重。
[0126]
4)通过上述几种方法计算的权重组合确定各样本井数据点的权重
[0127]
通过上述几种方法计算获得样本井数据的权重系数后,也可以根据一种或多种方法确定的权重系数组合确定最终该井对应样本数据点的权重系数,例如b井通过井与样本井之间的距离确定的权重系数为0.81,通过待处理井与样本井的地质属性确定的权重系数为0.43,通过待处理井与样本井的曲线相似性确定的权重系数为0.43,则最终该井对应样本数据点的权重系数:
[0128]wcb
=(0.81 0.43 0.43)/3=0.56。
[0129]
4.建立机器学习网络模型
[0130]
本发明采用长短期记忆网络(lstm)建立曲线预测模型,模型采用7层网络结构,tensorflow搭建lstm模型。模型超参数设置如下:
[0131]
输入测井曲线数量data_dim=6;
[0132]
序列长度数seq_length=20;
[0133]
每层网络隐藏层神经元数hidden_dim=49;
[0134]
输出曲线维度output_dim=1;
[0135]
lstm layer层数n_layers=5;
[0136]
dropout比例dropout_rate=0.2;
[0137]
学习率learning_rate=0.005;
[0138]
批处理大小batch_size=640;
[0139]
所有数据迭代轮数epochs=30。
[0140]
5.利用样本井数据对机器学习模型进行训练和验证。
[0141]
6.在待处理井段,利用步骤108训练完成的机器学习模型,获得预测的曲线结果。
[0142]
利用上述训练完成的机器学习模型,在在待处理井段,利用训练完成的机器学习
模型,获得预测的曲线结果。操作与步骤110模型验证阶段类似,此时已知其它测井曲线值,输入到训练完成的机器学习模型中,即可获得对应的目标曲线预测结果。
[0143]
图7是利用本发明设定样本数据点权重预测效果与传统方法预测效果的对比,两种方法预测结果均基于长短期记忆网络(lstm),如步骤108所述,网络模型超参数均保持一致,保证了预测结果的可对比性。图中第一道是井径曲线,第二道是自然伽马曲线,第三道是深度曲线,第四道是地层层位,第五道是深、浅电阻率曲线,第六道是密度曲线,第七道是补偿中子曲线,第八道是纵波时差曲线,第九道是根据通过阵列声波测井实测的横波时差曲线,第十道是传统等样本数据点权重的方法预测的横波时差曲线与实测横波时差曲线的对比;第十道是本发明按步骤106所述对三种方法计算权重取平均值后(即步骤106所述的方法4)设置样本数据点权重预测的横波时差曲线与实测横波时差曲线的对比。从图中可见,本发明方法预测的横波时差曲线在曲线变化趋势、曲线幅度上明显与实测横波时差曲线更为吻合,预测精度更高。
[0144]
图8是本发明方法与传统方法预测效果对比,其中左图为传统等样本数据点权重的方法预测的横波时差曲线与实测横波时差曲线的对比,右图为本发明按步骤106所述对三种方法计算权重取平均值后(即步骤106所述的方法4)设置样本数据点权重预测的横波时差曲线与实测横波时差曲线的对比,对比可见,传统方法预测结果与实测横波时差曲线数据点分散,相关系数约为0.37,而本发明方法与实测横波时差曲线数据点分布更为集中,相关系数约为0.50,精度更高。
[0145]
本发明实施例中还提供了一种缺失测井曲线预测装置,如下面的实施例所述。由于该装置解决问题的原理与缺失测井曲线预测方法相似,因此该装置的实施可以参见缺失测井曲线预测方法的实施,重复之处不再赘述。
[0146]
图9为本发明实施例中缺失测井曲线预测装置结构框图,如图9所示,该装置包括:
[0147]
信息获取模块02,用于获取研究区的测井曲线、层位数据、井位数据和地质信息,所述地质信息包括地质构造或沉积相或岩相古地理;
[0148]
曲线组合优选模块04,用于根据研究区的测井曲线齐全井段的预设待预测曲线与其它测井曲线之间的相关性,优选用于建立机器学习网络模型的测井曲线组合;
[0149]
权重确定模块06,用于根据研究区的测井曲线、层位数据、井位数据和地质信息,确定用于机器学习模型训练的样本井数据的权重,所述样本井为研究区的测井曲线齐全井,样本井数据为样本井中不同深度位置的测井曲线值;
[0150]
机器学习网络模型构建模块08,用于构建机器学习网络模型;
[0151]
训练和验证模块10,用于利用样本井数据对机器学习网络模型进行训练和验证;
[0152]
预测模块12,用于根据研究区中的待处理井的已知测井曲线,利用训练和验证后的机器机器学习网络模型进行缺失测井曲线预测,获得待处理井的缺失测井曲线。
[0153]
在本发明实施例中,曲线组合优选模块具体用于:
[0154]
计算研究区的测井曲线齐全井段的预设待预测曲线与其它测井曲线之间的相关性;
[0155]
将所述相关性与预设相关系数阈值进行比较,当所述相关性超过预设相关系数阈值时,选择相应的测井曲线组成测井曲线组合。
[0156]
在本发明实施例中,权重确定模块具体用于:
[0157]
利用以下一种或多种组合确定用于机器学习模型训练的样本井数据的权重:
[0158]
根据井位数据,确定用于机器学习模型训练的样本井数据的权重;
[0159]
或,根据研究区的地质信息、测井曲线和层位数据,确定用于机器学习模型训练的样本井数据的权重;
[0160]
或,根据研究区的测井曲线和层位数据,确定用于机器学习模型训练的样本井数据的权重。
[0161]
在本发明实施例中,权重确定模块具体用于:
[0162]
按照如下方式根据井位数据和层位数据确定用于机器学习模型训练的样本井数据的权重:
[0163]
根据待处理井的井位数据和样本井的井位数据,计算待处理井与样本井之间的距离,根据所述距离确定用于机器学习模型训练的样本井数据的权重。
[0164]
在本发明实施例中,权重确定模块具体用于:
[0165]
按照如下公式确定根据所述距离确定用于机器学习模型训练的样本井数据的权重:
[0166][0167]
其中,w
db
是样本井数据的权重系数,0≤w
db
≤1;a、b为工区的权重值计算系数,一般设置a=1、b=0;lm为工区最大井距;(x0,y0)为待处理井的井位坐标,(xb,yb)为样本井的井位坐标。
[0168]
在本发明实施例中,权重确定模块具体用于:
[0169]
按照如下方式根据研究区的地质信息、测井曲线和层位数据确定用于机器学习模型训练的样本井数据的权重:
[0170]
基于研究区的地质信息划分多个区块;
[0171]
在每个区块选择多个典型井;
[0172]
将待处理井所在区块作为参考区,确定参考区典型井和其它区块典型井的平均相似性;
[0173]
将所述平均相似性作为用于机器学习模型训练的样本井数据的权重。
[0174]
在本发明实施例中,权重确定模块具体用于:
[0175]
按照如下方式将待处理井所在区块作为参考区,确定参考区典型井和其它区块典型井的平均相似性:
[0176][0177]
其中,num
refer
表示参考区中典型井数量;numi表示第i沉积相带中典型井的数量;s
lk
表示参考区中第l口井与第i沉积相带中第k口井之间的相似性;表示第i沉积相带与参考区的平均相似性;i表示沉积相带的编号;l、k为井编号。
[0178]
在本发明实施例中,权重确定模块具体用于:
[0179]
按照如下方式根据研究区的测井曲线和层位数据确定用于机器学习模型训练的样本井数据的权重:
[0180]
确定样本井的优选测井曲线组合和待处理井的优选测井曲线组合;
[0181]
基于样本井的优选测井曲线组合和待处理井的优选测井曲线组合,确定每一层位对应测井曲线的相似性;
[0182]
基于所述相似性确定用于机器学习模型训练的样本井数据的权重。
[0183]
在本发明实施例中,权重确定模块具体用于:
[0184]
按照如下公式基于所述相似性确定用于机器学习模型训练的样本井数据的权重:
[0185][0186]
其中,ρi′
表示第i

条曲线的指定权重;si′
为样本井某层位第i

条曲线与待处理井对应曲线的相似性;w
as
为样本井在相应层段的权重系数;n为测井曲线组合中曲线的总数目。
[0187]
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述缺失测井曲线预测方法。
[0188]
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述缺失测井曲线预测方法的计算机程序。
[0189]
本发明实施例中,与以往处理方法相比,本发明提出的测井曲线预测方法能够对用于建立测井曲线预测模型的样本数据集进行加权处理,据此可以实现按井位距离、油藏地质模型、曲线形态特征等方式设置样本数据集中不同井、不同层段数据点的在模型训练时的权重,将与待处理井距离较近、地质特征近似、曲线形态相似的样本井数据权重设定较高,从而增加这些样本井数据在预测模型训练中的贡献程度,显著提升了利用机器学习方法预测缺失曲线的精度。
[0190]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0191]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0192]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0193]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0194]
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献