老哥学习网 - www.lg9.cn 2024年05月12日 15:20 星期日
当前位置 首页 >公文范文 > 公文大全 >

联合专家解释样本及正演样本的三维断层自动识别方法

发布时间:2023-06-30 09:40:04 浏览数:

于会臻

(中国石化胜利油田分公司勘探开发研究院,山东东营 257015)

断层在油气运移和聚集过程中发挥着重要的作用[1-3],但精细的断层识别结果需要开展大量繁琐的三维地震解释工作。为有效提升断层识别效率及精度,相干[4-5]、边缘检测[6]、方差[7]、曲率[8-9]和断层似然性[10]等常规断层识别技术得到不断发展,研究思路主要是通过人工设计的算法及流程凸显同相轴的不连续性,实现断层特征的增强。然而受观测数据和处理噪声等非地质因素的影响,识别结果中包含较多干扰信息,需利用蚂蚁追踪[11-12]、平滑滤波[13]、最优面投票[14]等算法来进行后续处理,在算法应用过程中参数选择困难,存在较强主观性,效率和可靠性有待进一步提升。近年来,随着大数据及人工智能技术的发展,基于深度学习的地震自动解释方法得到广泛关注。在基于深度学习的断层自动识别方法中,根据样本数据来源将其大致分为2 类:第一类是基于正演模拟方法构建样本数据[14-15];
第二类是基于实际资料构建样本数据[16-20]。2 类方法各有优势及不足,第一类方法的优势在于可快速形成深度学习所需的大量样本数据,但问题在于理论模型无法完全反映复杂的真实断层分布特征及地震反射特征,复杂断层的识别精度有待进一步提升;
第二类方法虽然利用实际资料进行模型训练,但构建大量可靠的三维断层专家解释识别样本库较困难,数据不足和复杂断层识别的主观性会严重影响断层识别网络模型的泛化能力。如何充分融合2类断层样本数据的优势还需深入研究。为此,笔者提出了一种联合专家解释样本及正演样本的三维断层自动识别方法,主要包含3个关键内容:一是不完备断层样本标签损失函数的改进,为降低未解释区域断层样本标签不明确对断层识别网络模型参数优化带来的干扰,将断层识别损失函数计算的重点集中于已解释断层附近的位置区域,即断层解释聚焦区域;
二是二维断层专家解释样本数据的增强处理,通过二维样本数据维度扩充、三维断面扭曲、三维空间旋转等方法对二维断层专家解释样本数据进行三维增强处理,以增加专家解释样本的多样性;
三是三维断层自动识别网络结构的设计,引入自注意力机制,构建了联合专家解释样本及正演样本的三维断层自动识别网络结构,断层识别精度和可靠性得到进一步提升。

1.1 不完备断层专家解释样本标签损失函数改进

断层识别深度神经网络正向传播过程可表达为:

为保证地震数据经过神经网络得到的断层识别输出结果与断层样本标签最为匹配,期望得到的深度神经网络权重参数W应满足预测结果和已知标签之间的目标函数最小,其表达式为:

假设在断层的采样点位置标记为1 类,在非断层的采样点位置标记为0 类,则在三维地震数据体中识别断层的问题可类比为二分类的语义分割问题。常用的语义分割损失函数包括交叉熵损失(Cross-Entropy)[21]、焦点损失函数(Focal Loss)[22]、骰子损失函数(Dice Loss)[23]等。由于断层在三维空间中的数量远远少于非断层的数量,样本类别存在不平衡的问题,因此选用了基于Dice Loss 改进后的Log Cosh Dice Loss损失函数[24],其表达式为:

受勘探认识程度和工作量等客观因素的影响,往往只对三维地震工区的重点区域进行精细的断层解释,未解释区域缺少断层专家解释结果,且样本标签存在不完备性问题。为此,常规损失函数已不适用于此类断层样本标签,而应着重关注已解释断层附近的位置区域,即断层专家解释聚焦区域,以增强断层自动识别网络模型的可靠性。

基于上述讨论,断层专家解释聚焦区域的生成方式为:

B的尺寸与地震剖面和断层专家解释样本标签Fr的尺寸相同。在此基础上,构建断层专家解释聚焦区域掩码权重M(尺寸与B相同),其表达式为:

则改进后的不完备断层专家解释样本标签损失函数表达式为:

1.2 二维断层专家解释样本数据增强处理

实际资料的地震解释结果多为二维数据,为将其与三维正演样本数据进行有机融合,需要对其进行维度扩充处理,并在此基础上,利用三维断面扭曲、三维空间旋转等方法对样本数据进行增强处理,以提供更丰富的断层专家解释样本数据,从而进一步增加三维断层识别网络模型的泛化能力。具体步骤如下:

第1 步:二维断点专家解释结果的空间插值。在三维直角坐标系(X,Y,T)下,设二维实际地震剖面,其X和T方向的原始位置向量分别为x0和t0,对专家解释的断点进行分段插值得到连续的断层,如图1a红色线所示。红色断层线附近的采样点位置赋值为1,表示为已解释断层;
其他采样点位置赋值为0,表示非断层,其中也包含未解释区域的断层,则可得到与实际地震剖面相对应的二维断层专家解释样本标签Fr0。

第2 步:二维样本数据维度扩充。将二维实际地震剖面Sr0和二维断层专家解释样本标签Fr0沿着垂直于二维剖面Y方向进行复制扩充(图1b),得到维度扩充后的三维实际地震数据体Sr1和三维断层专家解释样本标签数据体Fr1尺寸变为Nt×Nx×Ny,其X,Y和T方向的原始位置向量分别为x0,y0和t0。

第3 步:三维断面扭曲。为进一步丰富断层样本数据的样式,将维度扩充后得到的三维实际地震数据体Sr1和三维断层专家解释样本标签数据体Fr1沿着X方向进行任意扭曲。采用多个正弦信号叠加的形式模拟扭曲的断面形态(图1c),其表达式为:

按照三维断面扭曲后的位置向量x1,y0和t0对三维实际地震样本数据体Sr1和三维断层专家解释样本标签数据体Fr1进行插值,获得断面扭曲后的三维实际地震数据体Sr2和三维断层专家解释样本标签数据体Fr2。

第4 步:三维空间旋转。对断面扭曲后的三维实际地震数据体Sr2和三维断层专家解释样本标签数据体Fr2沿着不同方位角进行旋转(图1d),其表达式为:

图1 断层专家解释样本数据增强图Fig.1 Fault data enhancement of expert interpretation samples

按照三维空间旋转后的位置向量x2,y1和t0对三维实际地震样本数据体Sr2和三维断层专家解释样本标签数据体Fr2进行插值,获得空间旋转后的三维实际地震数据体Sr3和三维断层专家解释样本标签数据体Fr3。

重复第3 和第4 步,随机设置不同的扭曲和方位旋转参数,可获得大量不同弯曲形态和旋转角度的三维实际地震数据体和三维断层专家解释样本标签数据体的增强处理结果,增加实际资料断层专家解释样本数据的多样性。

1.3 三维断层自动识别网络结构设计

断层识别可类比为图像语义分割问题。在该领域研究中,DeepLab[25-27],PSPNet[28],FCN[29]和UNet[30]等网络结构已在自动驾驶[31-32]、医学图像分析[33-34]等语义分割应用场景中取得了理想的应用效果。同时,研究者在上述网络结构的基础上,不断完善中间层特征提取能力,引入了在自然语言处理领域取得应用突破的自注意力机制,提出了SANet[35],CCNet[36]和DANet[37]等网络结构,语义分割效果得到进一步提升。借鉴上述研究思路,构建了联合专家解释样本及正演样本的三维断层自动识别网络结构(图2)。

基本网络结构借鉴UNet3+[38],主要包括编码和解码2 个过程(图2)。编码过程包含4 个特征提取块(E1,E2,E3,E4),从小尺度到大尺度逐步提取地震反射特征;
解码过程包含3 个特征恢复块(D1,D2,D3),分别与前3个特征提取块(E1,E2,E3)一一对应,分别恢复不同尺度特征的断层识别结果。与U-Net和UNet++[39]相比,UNet3+重新设计了跳跃连接,解码过程可直接融合来自不同尺度的特征提取块和上层特征恢复块的特征,既能捕获全尺度下的细粒度语义和粗粒度语义,又能减少训练参数。同时,对每个特征恢复块输出结果进行深度监督,即在每一个特征恢复块模块的最后一层被送入1 个3×3×3的卷积层,并通过1 个双线性上采样层得到样本标签一样大小的特征图,再加入1 个Sigmoid 函数层,之后利用(6)式分别计算不同尺度断层识别结果与样本标签间的匹配程度。

图2 联合专家解释样本及正演样本的三维断层自动识别网络结构Fig.2 Network structure of automatic 3D fault identification method driven by data from expert interpretation samples and forward modeling samples

构建的网络结构不仅需要学习样本数据与标签之间的关系,还应能分析断面上不同断点及其地震反射特征的空间相关关系。通常采用增加卷积神经网络的层数或改变卷积核尺寸的方法来增大视野、增强多尺度分析能力,但网络层数过多会使权重参数的数量及求解难度增加,故盲目扩大卷积核尺寸会导致细节信息的丢失。自注意力机制可动态计算中间层的空间结构特征,具有比卷积层更大的视野。为此,在每个特征提取块和特征恢复块都添加了具有更强数据空间特征分析能力的Halo⁃Net[40]注意力层,即每个特征提取块改为一个3×3×3的卷积层、HaloNet 注意力层、ReLU 激活函数和2×2×2 的最大池化层的连接,每个特征恢复块改为一个3×3×3的转置卷积层、HaloNet 注意力层、ReLU 激活函数的连接。HaloNet采用分块自注意力机制,既保证大规模样本数据计算效率的提升,也有助于获得更高精度的三维断层自动识别网络模型。

综上所述,制定了联合专家解释样本及正演样本的三维断层自动识别方法的技术流程(图3),具体步骤包括:①二维断层专家解释样本数据标准化处理。针对不同工区的二维实际地震数据及断层专家解释样本标签数据,沿着垂直时间和水平地震道方向分别进行重采样或插值处理,将数据的时间间隔和道间距进行统一,保证训练数据的一致性。②二维断层专家解释样本数据增强处理。对一致性处理后的地震数据和断层专家解释样本标签进行维度扩充及随机的断面扭曲和方位三维空间旋转,形成大量的三维断层专家解释样本数据。③三维断层正演样本数据构建。根据文献[15]方法,针对各类断层发育模式,设置地层褶皱幅度、断层倾角、方位角、子波峰值频率和噪声等参数,形成大量三维断层正演样本数据。④三维断层自动识别网络结构构建。建立联合专家解释样本及正演样本的深度学习断层自动识别网络。⑤三维断层自动识别网络参数设置及优化。整理增强后的三维断层专家解释样本数据和三维断层正演样本数据,按照K折交叉验证流程形成训练集和验证集。设置最大迭代轮次、学习率等网络训练关键参数,在样本数据的驱动下,利用Adam[41]优化算法进行迭代求解,得到三维断层自动识别网络模型。⑥验证集评价分析及获得最终三维断层自动识别网络模型。将训练得到的三维断层自动识别网络模型在验证集上进行测试评价,当满足评价目标时,将该三维断层自动识别网络模型作为最终模型。否则,反复修正网络参数,直至满足评价要求。⑦实际应用。将最终获得的三维断层自动识别网络模型应用于实际工区,实现高效、高精度的三维断层自动识别。

图3 联合专家解释样本及正演样本的三维断层自动识别方法技术流程Fig.3 Technical flowchart of automatic 3D fault identification method driven by data from expert interpretation samples and forward modeling samples

3.1 数据预处理

通过三维断层正演模型来验证本文方法的可靠性。构建了200 对尺寸为256×512×256(nx×ny×nt)的三维断层模型及地震数据作为模型实验样本集。将该样本集分为3 份,其中40%作为待解释的三维地震数据,40%作为三维断层正演样本数据,另外20%作为验证集。

对于待解释的三维地震数据,进行随机剖面断层解释,断层解释数量为所有断层数量的75%。利用所提的样本数据增强处理方法得到断层专家解释样本数据集合,与其他三维断层正演样本数据进行联合,作为最终使用的训练集。采用图2 网络结构,利用Adam 算法进行参数优化,学习率设置为0.000 1,迭代轮次为100。通过不断迭代训练得到三维断层自动识别网络模型。

3.2 效果分析

图4a 为验证集中的任意二维地震剖面数据,图4b 为其对应的断层专家解释样本标签数据。对比常规损失函数的断层自动识别结果(图4c)和损失函数改进后的断层自动识别结果(图4d)可以看出,由于训练集断层样本标签的不完备性,常规损失函数无法准确评估地震响应特征是否对应断层,反向传播时影响了权重参数求解的可靠性,导致部分断层没有得到有效识别。而利用改进后的损失函数,在已解释断层的聚焦区域内进行地震反射特征与断层相关关系分析,网络训练的目标更加明确,断层自动识别与真实标签的吻合度显著提高,验证集的模型测试正确率为96%左右。同时,在优化方法、学习率、迭代轮次等超参数固定的前提下,相比U-Net,UNet++,UNet3+等网络结构,所提出的网络结构更好地提升了地震空间特征分析能力,断层识别正确率可提升3%~4%。

图4 损失函数改进前后的断层自动识别结果对比Fig.4 Comparison of automatic fault identification results before and after improvement of loss function

选取胜利油田东部某工区开展应用测试。该试验区位于东营凹陷东北部,为一复杂断块油气藏。断层样本数据包括收集整理的相邻工区共80个地震剖面断层专家解释结果和正演模拟构建的400 对256×256×256 三维断层样本数据。网络训练采用Adam 算法进行优化,学习率为0.000 1,迭代轮次为100,通过反复迭代优化得到最终断层自动识别网络模型。

对比地震断层属性与深度学习断层识别方法,从图5a可以看出,本征相干属性检测到地震反射不连续性,但断层识别结果噪声干扰强,垂向上连续性差,不利于开展后续的解释工作。图5b是常规深度学习的断层自动识别结果,仅采用了正演样本数据和常规UNet3+网络进行断层网络模型的训练和自动识别。相比图5a来说,新方法的断层自动识别剖面(图5c)和三维显示(图5d)中三维断层自动识别结果都具有更好的空间连续性、抗噪性,究其原因是通过多层次的特征提取及恢复,同时考虑了小时窗内的断层细节变化和大时窗内的断层结构变化,从而提升了断层识别结果的可解释性。

图5 不同方法下断层自动识别结果对比Fig.5 Comparison of automatic fault identification results by different methods

对比图5b和图5c可知,新方法在融合了基于专家经验的断层解释样本数据之后,断层识别结果更加符合地质经验认识。例如,对于地震剖面右下方的低角度断层,常规深度学习的断层自动识别结果(图5b)未能准确预测,而新方法的断层自动识别结果(图5c,5d)有效地识别出了该断层,与已知地质认识更加吻合,可为后续断面组合分析提供更为可靠的参考依据,也验证了该方法的实用性。

提出了一种联合专家解释样本及正演样本的三维断层自动识别的新方法。断层样本数据的数据量、多样性和可靠性是影响断层自动识别应用效果的重要因素,为更好地发挥断层专家解释样本数据与断层正演样本数据的各自优势,在不完备断层样本标签损失函数、二维断层专家解释样本数据增强处理、联合专家解释样本及正演样本的三维断层自动识别网络结构等3 个方面进行了改进和创新。相比现有的深度学习断层自动识别方法,笔者所提的新方法既能充分融合丰富的实际地震数据和断层发育特征,还能加入大量的三维断层正演样本数据进行共同训练,在保证识别效率的前提下,三维断层自动识别网络模型的泛化能力和精度都得到进一步提升。

新方法的研究思路不仅适用于断层自动识别,也可应用于岩相岩性识别、层位解释等其他智能地震解释工作。在下步工作中,将根据不同构造样式、岩性变化等地质情况,优化样本增强和正演模拟流程,构建规模更大、样式更丰富的专家解释样本及正演样本数据库,并开展地震资料自动优化、已有构造解释成果约束、低序级断层自动识别、断面自动组合等方法的深入研究,更加系统地考虑断层识别问题,从而实现高精度三维断裂系统的快速构建。

符号解释

B——断层专家解释聚焦区域;

D1,D2,D3——三维断层自动识别网络的3 个特征恢复块;

E1,E2,E3,E4——三维断层自动识别网络的4 个特征提取块;

f(·)——非线性激活函数;

F——断层样本标签;

Ff——正演模型的断层样本标签;

Fr——断层专家解释样本标签;

Fr0——二维断层专家解释样本标签;

Fr1——维度扩充后的三维断层专家解释样本标签数据体;

Fr2——断面扭曲后的三维断层专家解释样本标签数据体;

Fr3——空间旋转后的三维断层专家解释样本标签数据体;

——地震数据经过神经网络得到的断层识别输出结果;

——地震正演模拟数据经过神经网络得到的断层识别输出结果;

——实际地震数据经过神经网络得到的断层识别输出结果;

g——全部元素为1的二维卷积核;

J——目标函数;

k——模拟断层弯曲形态所需正弦弯曲曲线编号,取值为1~K;

K——模拟断层弯曲形态所需正弦弯曲曲线的总个数;
L——神经网络损失函数;

——骰子损失函数;

L′——Log Cosh Dice Loss损失函数;

Lnew——改进后的不完备断层专家解释样本标签损失函数;

M——断层专家解释聚焦区域掩码权重;

nt——时窗垂直时间采样点个数;

nx——时窗水平方向道的个数;

ny——时窗水平方向线的个数;

Nt——地震数据的双程旅行时间T方向维度;

Nx——地震数据X方向维度;

Ny——地震数据Y方向维度;

S——地震数据;

Sf——断层模型地震正演模拟数据;

Sr——实际地震数据;

Sr0——二维实际地震剖面;

Sr1——维度扩充后的三维实际地震数据体;

Sr2——断面扭曲后的三维实际地震数据体;

Sr3——空间旋转后的三维实际地震数据体;

t0——二维剖面T方向原始位置向量;

wk——第k个正弦弯曲曲线的角频率;

W——深度神经网络权重参数;

x0——二维剖面X方向原始位置向量;

x1——三维断面扭曲后的X方向位置向量;

x2——三维空间旋转后的X方向位置向量;

y0——维度扩充后的三维数据Y方向原始位置向量;

y1——三维空间旋转后的Y方向位置向量;

ak——第k个正弦弯曲曲线的振幅;

ψk——第k个正弦弯曲曲线的初相;

θ——旋转的方位角,(°)。

猜你喜欢自动识别网络结构断层基于数据挖掘的船舶航迹自动识别系统舰船科学技术(2022年10期)2022-06-17如何跨越假分数的思维断层数学教学通讯·小学版(2022年4期)2022-05-29嘛甸油田喇北西块一区断层修正研究西部探矿工程(2022年2期)2022-02-14X油田断裂系统演化及低序级断层刻画研究非常规油气(2021年5期)2021-11-13基于卫星遥感图像的收费站位置自动识别与校核中国交通信息化(2019年7期)2019-10-08自动识别系统特别健康(2018年3期)2018-07-04基于广义混合图的弱节点对等覆盖网络结构系统工程与电子技术(2016年7期)2016-08-21体系作战信息流转超网络结构优化系统工程与电子技术(2016年7期)2016-08-21基于IEC61850的配网终端自动识别技术电测与仪表(2016年6期)2016-04-11基于互信息的贝叶斯网络结构学习北京信息科技大学学报(自然科学版)(2016年6期)2016-02-27

推荐访问:样本 断层 自动识别

相关文章:

Top