技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种天然裂缝变尺度识别数据分析方法与流程  >  正文

一种天然裂缝变尺度识别数据分析方法与流程

  • 国知局
  • 2024-10-09 15:39:59

本发明涉及数据处理,尤其涉及一种天然裂缝变尺度识别数据分析方法。

背景技术:

1、天然裂缝的形成和演化与地质构造、地下水、应力场等因素密切相关,通过变尺度识别,可以更有效地理解裂缝在不同尺度下的分布特征和演变规律,有助于评估地质灾害风险,比如地面坍塌、岩溶崩塌等,从而提前预警和采取防范措施。除此之外在资源勘探和开发领域,裂缝对于储层性质和流体运移有重大影响,通过识别裂缝在不同尺度上的空间分布和连通性,可以优化资源勘探策略,提高资源的开发利用率。因此对天然裂缝进行变尺度的识别和分析在地质工程、石油勘探、矿业等领域具有广泛的应用意义。

2、而机器学习中的pca主成分分析可以很好的用于天然裂缝的变尺度分析和识别,具体的:通过收集裂缝的相关特征数据,例如通过激光扫描或摄影测量等方法获取尺寸、形状、位置和其他几何参数,并将收集的相关特征数据标准化后再输入pca算法中,提取出多种尺度下数据的主成分,由此帮助识别裂缝的主要变化模式。该pca算法通过最大化数据方差,提取主要特征,并降维简化复杂数据,从而识别和分析裂缝的主要变化模式,由此pca算法为裂缝尺度分析中的一种强大工具,能够揭示裂缝在不同特征上的重要变化并提供有效的尺度识别。

3、但pca算法在裂缝的变尺度分析过程中主成分的选择为一个关键且重要的步骤,传统方式下pca算法中的主成分的选择为特征值最大的特征向量,即保留方差最大值所对应的主成分;但对于当前场景而言,主成分的选择仅依赖于传统特征值最大的评估标准存在较高的局限性,且主成分的选择难以设定,较多的主成分选择会导致计算复杂度显著增加,影响尺度分析效率,同时存在过拟合风险或使得pca算法受噪声影响过大;而较少的主成分选择会导致信息丢失,解释能力下降,并影响pca算法的性能和准确性。

4、因此,如何在利用pca算法进行裂缝的变尺度分析时选择合适的主成分,以提高天然裂缝的变尺度分析和识别的效率成为亟需解决的问题。

技术实现思路

1、有鉴于此,本发明实施例提供了一种天然裂缝变尺度识别数据分析方法,以解决如何在利用pca算法进行裂缝的变尺度分析时选择合适的主成分,以提高天然裂缝的变尺度分析和识别的效率的问题。

2、本发明实施例中提供了一种天然裂缝变尺度识别数据分析方法,该方法包括以下步骤:

3、获取不同尺度下的天然裂缝数据,在所有天然裂缝数据中提取n个特征对应数据组成一个特征数据矩阵,其中,所述特征数据矩阵的每列代表一个特征,每行代表一个天然裂缝数据,利用pca算法对所述特征数据矩阵进行主成分分析,得到按照特征值从大到小对特征向量排序后的特征向量序列;

4、针对所述特征向量序列中的任一特征向量,获取所述特征数据矩阵的对角矩阵,根据所述特征向量上的数据点之间的距离和所述对角矩阵,获取所述特征向量属于最优主成分的评估参考指标;

5、在所述特征向量序列中按顺序累加选取m个特征向量,并根据所述m个特征向量的特征值和评估参考指标,获取所述m个特征向量的优选判定指标,直至所述优选判定指标大于或等于预设判定指标阈值,则将对应的m值作为主成分选取数量;

6、根据每个所述特征向量属于最优主成分的评估参考指标和所述主成分选取数量,在所有特征向量中筛选得到有效主成分,根据每个所述有效主成分进行天然裂缝的识别。

7、优选的,所述根据所述特征向量上的数据点之间的距离和所述对角矩阵,获取所述特征向量属于最优主成分的评估参考指标,包括:

8、根据所述特征向量上的数据点之间的距离和数量,获取所述特征向量的数据分布平稳指标,获取所述对角矩阵的特征值,根据所述对角矩阵的特征值和所述特征向量的数据分布平稳指标,得到所述特征向量属于最优主成分的评估参考指标。

9、优选的,所述根据所述特征向量上的数据点之间的距离和数量,获取所述特征向量的数据分布平稳指标,包括:

10、获取所述特征向量上的第一个数据点和最后一个数据点之间的距离,对所述距离进行归一化处理,得到对应的归一化值;

11、分别获取所述特征向量上每两个相邻数据点之间的距离,得到距离之和、最大距离和最小距离,获取所述最大距离和所述距离之和的第一比值,获取所述最小距离和所述距离之和的第二比值,得到所述第一比值和所述第二比值之间的比值差值绝对值;

12、利用以自然常数为底数的指数函数,对所述比值差值绝对值进行负映射,得到对应的映射值,对所述映射值和所述归一化值进行加权求和,对应得到的结果作为所述特征向量的数据分布平稳指标。

13、优选的,所述根据所述对角矩阵的特征值和所述特征向量的数据分布平稳指标,得到所述特征向量属于最优主成分的评估参考指标,包括:

14、计算所述对角矩阵的特征值和所述特征向量的数据分布平稳指标之间均值作为所述特征向量属于最优主成分的评估参考指标。

15、优选的,所述根据所述m个特征向量的特征值和评估参考指标,获取所述m个特征向量的优选判定指标,包括:

16、根据所述m个特征向量的特征值,在所述m个特征向量中统计特征值大于预设值的特征向量数量,计算所述特征向量数量与所述m值之间的数量比值;

17、根据每个所述特征向量的评估参考指标,得到评估参考指标总和,分别计算所述m个特征向量中的每个特征向量的评估参考指标与所述评估参考指标总和的指标比值,得到指标比值序列;

18、计算所述指标比值序列中每两个相邻指标比值之间的差值,得到差值累加值,计算所述差值累加值的倒数与数量比值之间的均值作为所述m个特征向量的优选判定指标。

19、优选的,所述根据每个所述特征向量属于最优主成分的评估参考指标和所述主成分选取数量,在所有特征向量中筛选得到有效主成分,包括:

20、按照评估参考指标从大到小的顺序,在所有特征向量中选取与所述主成分选取数量相等的k个特征向量作为有效主成分。

21、本发明实施例与现有技术相比存在的有益效果是:

22、本发明获取不同尺度下的天然裂缝数据,在所有天然裂缝数据中提取n个特征对应数据组成一个特征数据矩阵,其中,所述特征数据矩阵的每列代表一个特征,每行代表一个天然裂缝数据,利用pca算法对所述特征数据矩阵进行主成分分析,得到按照特征值从大到小对特征向量排序后的特征向量序列;针对所述特征向量序列中的任一特征向量,获取所述特征数据矩阵的对角矩阵,根据所述特征向量上的数据点之间的距离和所述对角矩阵,获取所述特征向量属于最优主成分的评估参考指标;在所述特征向量序列中按顺序累加选取m个特征向量,并根据所述m个特征向量的特征值和评估参考指标,获取所述m个特征向量的优选判定指标,直至所述优选判定指标大于或等于预设判定指标阈值,则将对应的m值作为主成分选取数量;根据每个所述特征向量属于最优主成分的评估参考指标和所述主成分选取数量,在所有特征向量中筛选得到有效主成分,根据每个所述有效主成分进行天然裂缝的识别。其中,通过分析主成分分析之后的每个特征向量属于最优主成分的评估参考指标和所需的主成分选取数量,能够避免传统方式下仅根据特征值大小进行主成分排序,且在不影响计算复杂度效率的同时保留裂缝重要的变化信息,达到有效分析和识别裂缝变尺度特征的效果,揭示裂缝的主要变化模式和影响因素。

本文地址:https://www.jishuxx.com/zhuanli/20241009/309538.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。