技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法 > 正文

基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法

国知局
2025-01-10 13:16:00

本发明涉及岩性识别，具体涉及一种基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法。

背景技术：

1、随钻测量(mwd)技术能够实时测量钻进过程中钻机的运行参数，从而为岩体特性提供具体信息。利用随钻测量参数进行岩性识别是一种综合性技术，具有高精度、多信息、集成化等特点，可显著提高识别效率。多年来，随钻测试技术已被广泛应用于岩体开挖过程。历经多年发展随钻测试技术逐步完善，推动了数据采集的实时性及钻进参数与岩性之间表征研究的进程。在揭示钻进数据与岩体特征关系方面，主要从方法和判别目标两个方面总结。在方法层面，国内外学者进行了大量探索。值得注意的是，目前基于ml的岩石特征研究中，数据不平衡问题受到越来越多的关注。由于实际地质条件中岩类分布具有不确定性，不同岩石的样本数量不可避免地会失衡。当类标签不平衡时，主要采用两种思路来规避该现象，即通过上采样增加少数样本或下采样减少多数样本。来进行深入分析。然而，一些研究通过将少数类样本扩充至与多数类样本数量一致来处理。这在一定程度上可缓解数据不平衡并提高预测性能。然而，当类标签数量高度失衡时，简单地使两类样本数量一致可能导致预测结果不可靠。

技术实现思路

1、针对现有技术中的上述不足，本发明提供的一种基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法解决了现有技术无法有效缓解数据不平衡导致的预测精度和可靠程度低的问题。

2、为了达到上述发明目的，本发明采用的技术方案为：

3、提供了一种基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其包括以下步骤：

4、s1、实时采集待识别的新奥法隧道的掘进过程的随钻测量mwd数据，即多维不平衡数据；

5、s2、对多维不平衡数据进行预处理，得到预处理后的多维不平衡数据；

6、s3、采用adasyn过采样算法对预处理后的多维不平衡数据进行处理，得到过采样后的mwd数据；

7、s4、构建岩性识别模型；

8、s5、将过采样后的mwd数据输入至岩性识别模型进行处理，得到岩性识别结果。

9、进一步地，步骤s1中的多维不平衡数据包括钻孔深度、推进速度、冲击压力、推进压力、回转压力、水压力和水流量。

10、进一步地，步骤s3包括以下步骤：

11、s3-1、将预处理后的多维不平衡数据作为样本数据，并统计每类样本数据的数据量；

12、s3-2、判断每类样本数据的数据量是否小于数量阈值；若是则判定该类样本数据为少数类别样本；反之则判定该类样本数据为多数类别样本；

13、s3-3、采用k近邻算法在少数类别样本构成的少数类数据空间中确定各少数类别样本对应的k个最近邻样本数据；

14、s3-4、根据公式：

15、

16、得到各少数类别样本的密度ri；其中，ni表示第i个最近邻样本数据，k表示最近邻样本数据总数；

17、s3-5、根据公式：

18、

19、得到需要生成的合成样本数量gi；其中，nmaj表示多数类别样本数据总量，nmin表示少数类别样本数据总量，β表示生成新样本的比例，∑(·)表示求和函数；

20、s3-6、基于需要生成的合成样本数量gi，通过随机线性插值对各少数类别样本生成对应的合成样本；

21、s3-7、分别合并各少数类别样本和对应的合成样本；

22、其中，过采样后的mwd数据包括多数类别样本和合并后的少数类别样本。

23、进一步地，步骤s4中的岩性识别模型采用xgboost模型。

24、进一步地，岩性识别模型的训练过程包括以下步骤：

25、s5-1、获取训练多维不平衡数据及其标签，采用与步骤s3相同的方法进行过采样，得到过采样后的训练mwd数据；

26、s5-2、利用gs网格搜索法对xgboost模型的超参数进行处理，得到对应的超参数组合方案；

27、s5-3、随机选取一个超参数组合并应用至xgboost模型，得到对应的初始xgboost模型；

28、s5-4、将过采样后的训练mwd数据输入至初始xgboost模型并采取十折交叉验证进行处理，得到十个初始指标数据值，即macrof1值；

29、s5-5、计算十个初始指标数据值的指标均值；

30、s5-6、重复步骤s5-3至步骤s5-6，直至得到所有超参数组合对应的指标均值；

31、s5-7、基于各个指标均值，选取最佳超参数；

32、s5-8、基于最佳超参数调整初始训练xgboost模型的参数，得到训练优化后的gs-adasyn-xgboost模型。

33、进一步地，gs网格搜索法的具体过程为：

34、确定xgboost模型的待优化超参数；设置待优化超参数的取值范围，并对待优化超参数的取值进行排列组合，生成超参数网格；初始化xgboost模型并设置初始超参数；利用gridsearchcv法对参数网格进行网格搜索，得到对应的超参数组合方案。

35、进一步地，步骤s5-4包括以下步骤：

36、s5-4-1、将过采样后的训练mwd数据分为十个子集；

37、s5-4-2、随机选择一个子集作为验证子集，其余九个子集作为训练子集；

38、s5-4-3、将训练子集及其标签输入至初始xgboost模型进行训练，得到训练后的初始xgboost模型；

39、s5-4-4、将验证子集输入至训练后的初始xgboost模型，得到对应的训练识别结果；

40、s5-4-5、基于训练识别结果计算对应的初始指标数据值；

41、s5-4-6、重复步骤s5-4-2至步骤s5-4-5直至得到十个初始指标数据值。

42、进一步地，步骤s5-1中的标签为安山岩、混合安山-砂岩、白云岩、砂岩、粉砂质页岩、青泥岩，分别设置为类别0、类别1、类别2、类别3、类别4、类别5。

43、本发明的有益效果为：本方法采用adasyn过采样方法对随钻测量mwd数据进行处理，解决了随钻测量mwd数据的多维数据不平衡问题；且利用网格搜索算法对岩性识别模型进行超参数优化，进一步提升了识别模型的泛性能力和识别能力；选取优化后的gs-adasyn-xgboost对随钻测量mwd数据进行分类，可以有效提高识别结果的准确性。

技术特征：

1.一种基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：所述步骤s1中的多维不平衡数据包括钻孔深度、推进速度、冲击压力、推进压力、回转压力、水压力和水流量。

3.根据权利要求1所述的基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：所述步骤s3包括以下步骤：

4.根据权利要求2或3所述的基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：所述步骤s4中的岩性识别模型采用xgboost模型。

5.根据权利要求4所述的基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：所述岩性识别模型的训练过程包括以下步骤：

6.根据权利要求5所述的基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：所述gs网格搜索法的具体过程为：

7.根据权利要求5所述的基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：所述步骤s5-4包括以下步骤：

8.根据权利要求5所述的基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，其特征在于：所述步骤s5-1中的标签为安山岩、混合安山-砂岩、白云岩、砂岩、粉砂质页岩、青泥岩，分别设置为类别0、类别1、类别2、类别3、类别4、类别5。

技术总结本发明公开了一种基于新奥法隧道开挖随钻数据的岩性数据驱动识别方法，涉及岩性识别技术领域。本方法采用ADASYN过采样方法对随钻测量MWD数据进行处理，解决了随钻测量MWD数据的多维数据不平衡问题；且利用网格搜索算法对岩性识别模型进行超参数优化，进一步提升了识别模型的泛性能力和识别能力；选取优化后的GS‑ADASYN‑XGBoost对随钻测量MWD数据进行分类，可以有效提高识别结果的准确性。技术研发人员：陈佳耀,李阳,沈一凡,米向东,房倩,舒亚健,邱隆亮受保护的技术使用者：北京交通大学技术研发日：技术公布日：2025/1/6