技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于特征融合的集成学习油井溢出检测方法及装置与流程 > 正文

基于特征融合的集成学习油井溢出检测方法及装置与流程

国知局
2024-09-11 14:48:22

本发明涉及油气勘探开发，特别是涉及一种基于特征融合的集成学习油井溢出检测方法及装置。

背景技术：

1、压井作业作为油气开采过程中的关键环节，其安全性对于预防溢流事件至关重要。近年来，随着人工智能和大数据技术的飞速发展，机器学习技术逐渐被引入到压井作业的预测和优化中，以寻求更高效、更安全的作业方法。然而，早期的探索主要集中在基于统计学的方法上，如回归分析、时间序列分析等，这些方法虽然在一定程度上提高了压井作业的预测能力，但在实际应用中仍暴露出诸多不足。

2、首先，传统的方法倾向于依赖静态模型，在压井作业中，地层压力和井筒状态可能因各种因素而实时发生变化，而静态模型无法及时捕捉这些变化，从而导致模型的预测结果与实际情况产生偏差，导致模型预测的时效性不足，进而降低了作业的安全性。其次，传统方法通常依赖历史数据进行分析和预测，传统方法通常依赖历史数据进行分析和预测，然而，在油气开采领域，历史数据可能无法充分反映当前和未来的作业环境，随着油田开发的深入，新的地质条件、井筒状况以及操作工艺不断涌现，这些因素都可能对压井作业的安全性产生影响，因此，仅仅依赖历史数据进行预测可能导致预测结果的不准确，甚至误导作业决策。

3、此外，回归分析和时间序列分析等方法在处理复杂的非线性关系和多变量间的相互影响时显得力不从心，在压井作业中，各种因素之间往往存在复杂的相互作用关系，这些关系可能是非线性的、难以用简单的数学模型进行描述，因此，传统方法在处理这些复杂关系时往往无法取得理想的效果，导致模型的预测能力受到限制。

技术实现思路

1、有鉴于此，本发明的目的在于提供一种基于特征融合的集成学习油井溢出检测方法及装置，以解决现有技术中在应对压井作业溢流风险时存在时效性差、预测不准确以及模型复杂度不足的问题。

2、为达到上述目的，本发明的一技术方案提供一种基于特征融合的集成学习油井溢出检测方法，包括以下步骤：

3、采集油井的油井特征数据并对所述油井特征数据进行预处理得到特征数据集；

4、构建特征评估模型，利用所述特征数据集对所述特征评估模型进行迭代训练，并基于所述特征评估模型预测得到各特征的评估分数以及根据所述特征评估模型的评估情况确定所述特征评估模型的评估准确率；

5、将所述评估分数及评估准确率进行融合得到特征序列；

6、构建特征预测模型，利用所述特征序列对特征预测模型进行迭代训练，输出特征预测数据；

7、根据所述特征预测数据对所述油井的溢出情况进行检测并预警。

8、进一步的，在所述采集油井的油井特征数据并对所述油井特征数据进行预处理得到特征数据集的步骤中，包括以下子步骤：

9、采集油井的油井特征数据，其中，所述油井特征数据包括多个特征的历史特征数据和实时特征数据，且所述油井特征数据携带有对应的溢出标签信息；

10、基于所述溢出标签信息以及所述油井特征数据的值对所述油井特征数据进行清洗；

11、将清洗后的油井特征数据进行标准化处理得到特征数据集；

12、其中，对所述油井特征数据进行清洗的具体方法为：

13、遍历各油井特征数据及对应的溢出标签信息，并获取各油井特征数据以及溢出标签信息的值，所述溢出标签信息的值包括空值、溢出值和正常值；

14、将所述空值、油井特征数据中的负值和非数值统一替换成正常值或者将所述正常值、油井特征数据中的负值统一替换成空值。

15、进一步的，在所述构建特征评估模型，利用所述特征数据集对所述特征评估模型进行迭代训练，并基于所述特征评估模型预测得到各特征的评估分数以及根据所述特征评估模型的评估情况确定所述特征评估模型的评估准确率的步骤中，所述特征数据集包括按照预设比例划分的第一特征数据集和第二特征数据集，包括以下子步骤：

16、基于梯度提升和集成学习分别构建梯度提升子模型和集成学习子模型；

17、将所述第一特征数据集分别输入所述梯度提升子模型和集成学习子模型对所述梯度提升子模型和集成学习子模型进行迭代训练，并通过训练好的梯度提升子模型和集成学习子模型输出第一评估数据；

18、将所述第一评估数据整合成各特征与各子模型对应的评估分数；

19、将所述第二特征数据集分别输入所述梯度提升子模型和集成学习子模型对所述梯度提升子模型和集成学习子模型进行迭代训练，并通过训练好的梯度提升子模型和集成学习子模型输出第二评估数据；

20、将所述第二评估数据整合成各子模型分别对各特征的第一评估数据进行评估时的评估准确率。

21、进一步的，所述梯度提升子模型包括多个第一基模型，利用第一特征数据集和第二特征数据集分别对梯度提升子模型进行迭代训练的具体方法包括：

22、对各第一基模型分别进行初始化；

23、分别将第一特征数据集和第二特征数据集输入初始化后的第一基模型，对各第一基模型进行迭代训练，直至所述第一基模型收敛或达到设定的最大迭代次数；

24、其中，对所述第一基模型迭代训练过程包括：

25、对于每一迭代轮次的第一特征数据集和第二特征数据集中的特征数据，分别计算各特征数据与当前轮次的第一基模型的预测值之间的残差；

26、定义一弱学习器，将所述弱学习器拟合至计算得到的残差上；

27、利用所述弱学习器迭代更新所述第一基模型，直至所述第一基模型收敛或达到设定的最大迭代次数得到训练后的第一基模型。

28、进一步的，所述集成学习子模型包括多个第二基模型，利用第一特征数据集和第二特征数据集分别对集成学习子模型进行迭代训练的具体方法包括：

29、初始化各第二基模型，并赋予第一特征数据集和第二特征数据集中各特征数据相同的权重系数；

30、定义若干弱分类器，并利用第一特征数据集和第二特征数据集对各弱分类器进行训练，输出各弱分类器在对应的特征数据预测上的错误率，并根据所述错误率对各特征数据的权重系数进行更新后再次输入对应弱分类器中迭代训练，直至各弱分类器收敛或达到设定的最大迭代次数；

31、将训练好的若干弱分类器组合成强分类器。

32、进一步的，在所述将所述第一评估数据整合成各特征与各子模型对应的评估分数的步骤中，所述第一评估数据包括多个第一基模型预测基于第一特征数据集预测得到的多个第一得分和多个第二基模型基于第一特征数据集预测得到的多个第二得分，整合后的评估分数表示为：

33、scorei＝feature_extitrain(xtrain,ytrain)；

34、其中，scorei为第i个基模型输出评估分数；feature_extitrain为以第一特征数据集进行模型训练时的第i个基模型，包括第一基模型和第二基模型；xtrain为以第一特征数据集进行模型训练时的第i个基模型的模型输入；ytrain为以第一特征数据集进行模型训练时的第i个基模型的模型输出；

35、在所述将所述第二评估数据整合成各子模型分别对各特征的第一评估数据进行评估时的评估准确率的步骤中，所述第二评估数据包括多个第一基模型基于第二特征数据集预测得到的多个第一预测结果和多个第二基模型基于第二特征数据集预测得到的多个第二预测结果，根据所述第一预测结果和第二预测结果的正确率整合得到所述评估准确率，整合后的评估准确率表示为：

36、

37、其中，acci为第i个基模型的评估准确率；为以第二特征数据集进行模型训练时的第i个基模型，包括第一基模型和第二基模型；xtest为以第二特征数据集进行模型训练时的第i个基模型的模型输；ytest为以第二特征数据集进行模型训练时的第i个基模型的模型输出。

38、进一步的，在所述将所述评估分数及评估准确率进行融合得到特征序列的步骤中，包括以下子步骤：

39、根据每一基模型对应的评估分数和评估准确率进行加权整合，得到各基模型对应各特征的加权得分矩阵，其中，各基模型对应各特征的加权得分表示为：

40、wi,j＝si,j×acci；

41、其中，wi,j为第i个基模型对应的第j个特征的加权得分，si,j为第i个基模型对应的第j个特征评估分数，scorei＝{si,j}(i＝1,2,...,i；j＝1,2,...,j)，i为基模型的数量，j为特征的数量，acci为第i个基模型的评估准确率；

42、将所述加权得分矩阵中的加权得分进行整合，得到每一特征的总得分，其中，所述总得分表示为：

43、

44、其中，kj为第j个特征的总得分；

45、将各特征按照总得分进行降序排列，得到特征序列。

46、进一步的，在所述构建特征预测模型，利用所述特征序列对特征预测模型进行迭代训练，输出特征预测数据的步骤中，包括以下子步骤：

47、基于梯度提升算法构建特征预测模型；

48、按照预设规则在所述特征序列中提取预设数量的特征对应的总得分；

49、将提取的预设数量的总得分输入所述特征预测模型对所述特征预测模型进行迭代训练，输出特征预测数据，其中，所述特征预测数据包括特征数量以及与以该特征数量的特征总得分为输入得到的最优准确率。

50、进一步的，在所述将提取的预设数量的总得分输入所述特征预测模型对所述特征预测模型进行迭代训练，输出特征预测数据的步骤中，所述总得分的预设数量为n，具体方法包括：

51、在n个总得分中依序取第一个总得分输入所述特征预测模型中进行迭代训练，输出第一预测准确率，再依序取前两个总得分输入所述特征预测模型中进行迭代训练，输出第二预测准确率，以此循环，直至取至n个总得分对特征预测模型中进行迭代训练，输出第n预测准确率；

52、比较各第一至第n预测准确率，并确定所述第一至第n预测准确率中的最优准确率；

53、根据所述最优准确率确定对应的参与特征预测模型训练的特征数量。

54、为达到上述目的，本发明的另一技术方案提供一种基于特征融合的集成学习油井溢出检测装置，其特征在于，包括：

55、数据采集模块，用于采集油井的油井特征数据并对所述油井特征数据进行预处理成特征数据集；

56、第一模型构建与训练模块，用于构建特征评估模型，以及利用所述特征数据集对所述特征评估模型进行迭代训练，并基于所述特征评估模型预测得到各特征的评估分数以及根据所述特征评估模型的评估情况确定所述特征评估模型的评估准确率；

57、特征融合模块，用于将所述评估分数及评估准确率进行融合得到特征序列；

58、第二模型构建与训练模块，用于构建特征预测模型，以及利用所述特征序列对特征预测模型进行迭代训练，并输出特征预测数据；以及

59、检测与预警模块，用于根据所述特征预测数据对所述油井的溢出情况进行检测并预警。

60、本发明通过对油井特征数据进行清洗，将油井特征数据的值以及其中携带的溢出标签信息的值进行替换，以确保油井特征数据的准确性和一致性，进而在后续模型训练过程中，确保模型能够准确处理该些数据，避免模型错误的解释各数据之间的潜在关系，从而达到提高模型的预测精度以及稳定性的目的。同时，本发明还通过设置两层模型，第一层的特征评估模型以采集到的历史油井特征数据和实时路径特征数据为输入，对各个特征的重要性进行评估以得到每一特征的评估分数以及各个基模型对于每一特征的评估分数进行评估时的评估准确率，并将每一特征的评估分数与每一基模型对于该特征评估时的评估准确率进行融合，得到每个特征的总得分，并以该总得分作为第二层的特征预测模型的输入进行得出在模型预测时最具有影响力的特征数量及对应的特征类型，不仅考虑了各个特征在单个模型中的重要性，还考虑了模型的整体预测能力，从而进一步提高模型的预测精度。

61、另外，本发明采集到的历史特征数据和当前时刻的实时特征数据包含了油井长时间的动态变化情况，并且在后续训练过程会根据时刻产生的新数据对模型进行动态更新，以确保模型的预测精度，为油井的溢出情况检测和预警提供重要的数据支撑，确保安全作业。