一种工程装备知识跨项目转移方法及系统
- 国知局
- 2024-10-21 15:14:21
本发明属于工程项目,尤其涉及一种工程装备知识跨项目转移方法及系统。
背景技术:
1、工程项目知识是项目型组织的重要资源,通过管理工程项目的知识来提高项目绩效,是工程项目管理的热点。作为工程项目知识管理的重要内容,工程项目知识的有效提取与转移由此成为研究的关键问题。作为工程项目知识的核心组成,关于工程装备(如盾构机、隧道掘进机等)知识的提取与转移的探讨更是研究的重点之一。通过充分提取、跨项目地转移工程装备中所蕴含的知识,能够及时为工程装备的管理和操作人员提供辅助决策的依据,可以有效规避由于项目初期知识经验的缺乏所导致的决策失误问题。然而,由于工程地质情况、工程装备参数以及施工项目其本身等诸多因素的差异性,使得跨项目转移的知识难以被有效利用。因此,如何增强工程装备知识的跨项目适应能力,进而提升工程装备知识的跨项目利用效率和效果,是工程项目知识管理亟待解决的重点与难点问题。目前,关于工程装备知识的提取与转移,有以下方面的研究:
2、(1)基于理论模型和数值分析。关注盾构与土体的相互作用,通过对大量的地质参数建模,研究盾构掘进过程中的受力机制。
3、(2)基于数据驱动的。利用盾构掘进过程中所产生的大量施工数据,建立机器学习模型和深度学习模型,学习施工数据与关键掘进参数之间的复杂映射关系。
4、(3)基于知识融合的。对历史施工数据按照特定策略进行划分得到多个数据分块,从数据分块中分别提取然后集成工程装备知识。
5、从现有研究中可以看出,基于理论模型和数值分析方法的性能受限于理论假设和参数设置。基于机器学习的方法难以处理高维非线性的时序数据,不能捕捉高维的时序信息。基于深度学习的方法虽在模型表达能力方面实现了跃进,却受限于训练数据的样本量,难以满足目标项目预测任务的精度要求。为了解决训练数据稀疏、待转移知识不适用的问题,提高对已有施工项目的知识利用率,迁移学习应运而生。迁移学习允许利用源项目的历史施工数据,完成知识从源域到目标域的跨项目转移,提高目标项目预测任务的准确性。但直接利用源项目的所有可用施工数据进行知识提取与转移可能会存在一些问题。首先,设备传感器数据通常以流数据的形式时序到来,这使得源项目本身在不同时刻的数据分布随时间动态变化。源项目的数据分布存在噪声,这使得通过利用源项目的所有数据所提取得到的知识也存在噪声。其次,由于项目环境和操作条件的不同,源项目和目标项目的数据分布会产生距离差异。即使在源项目上学得一个高度拟合源项目数据分布的学习模型,它也难以运用到与源项目具有不同数据分布的目标项目上。因此,应该考虑减小工程装备知识跨项目转移的噪声,充分提取可用工程装备知识,同时增强跨项目知识在目标项目上的适应性。
6、经对现有的技术文献的检索发现现有技术没有考虑到去除源域数据由于数据分布差异所带来的噪声,在融合结果时也没有同时利用多类知识使得模型更适应于目标域的数据。因此,亟需设计一种能够减小数据分布差异所导致的负迁移,同时提高待转移知识在目标域上适应能力的方法。
技术实现思路
1、针对现有技术中的上述不足,本发明提供的一种工程装备知识跨项目转移方法及系统,解决了现有知识转移方法缺乏考虑去除源域数据、由于数据分布差异所带来的噪声,在融合结果时也没有同时利用多类知识使得模型更适应于目标域的数据的问题,本发明有效地实现工程装备知识的跨项目转移。
2、为了达到以上目的,本发明采用的技术方案为:一种工程装备知识跨项目转移方法,包括以下步骤:
3、s1、利用改进的时序分块算法,将源项目数据划分为最具分布多样性的多个子域;
4、s2、利用混合深度神经网络模型,提取对各子域隐藏知识,以实现从源项目数据中提取待转移的知识;
5、s3、利用多知识的特征融合方法,融合提取的各子域隐藏知识,得到目标项目数据,完成工程装备知识跨项目的转移。
6、本发明的有益效果是:为减小工程装备知识跨项目转移的噪声,充分提取可用工程装备知识,同时通过利用多类知识来增强跨项目知识在目标项目上的适应性,本发明将完工项目(或积累数据多的项目)作为源项目数据,从其施工数据中学到潜在影响因素和预测变量之间的映射关系,即可转移的项目知识,并将其用于在建项目(目标项目)的预测任务,精准预测未来某时间间隔的盾构机姿态位置偏差,解决现有知识转移方法没有考虑去除源域数据、由于数据分布差异所带来的噪声,在融合结果时也没有同时利用多类知识使得模型更适应于目标域的数据的技术问题,有效地实现工程装备知识的跨项目转移。
7、进一步地,所述步骤s1包括以下步骤:
8、s101、结合源项目数据样本量和先验知识,确定候选分裂点数量的搜索集合n和分裂点数量的搜索集合k;
9、s102、遍历搜索集合n中每一个元素,确定n个候选分裂点,其中,所述n个候选分裂点将源项目数据均分为n+1个等分块;
10、s103、遍历搜索集合k中的每一个元素,通过得到关键分裂点pk获取当前分布差异dk;
11、s104、基于最大熵理论,返回步骤s103中的最大分布差异dk,记对应的分裂点个数为k*,记对应的k*个分裂点为其中,表示k*个分裂点;
12、s105、回溯步骤s102中的n值,获取最大分布差异dk对应的n值,记为n*,n表示候选分裂点数量;
13、s106、根据步骤s105到步骤s106的处理结果,获取最具分布多样性的多个子域e:
14、e=k*+1。
15、上述进一步方案的有益效果是:通过考虑源项目数据分布的时变特性,将源项目数据划分为最具分布多样性的多个子域,满足各个子域内部数据分布一致的同时,使各个子域之间的数据分布差异最大,从而消除源项目由于时变分布产生的数据噪声,便于后续利用子域的域特殊知识和分布知识进行多知识融合。
16、再进一步地,所述步骤s2包括以下步骤:
17、s201、对于第e个子域,利用卷积神经网络cnn提取包含空间表示信息的知识,其中,e∈e;
18、s202、利用长短期记忆网络lstm,对包含空间表示信息的知识进行整合,得到隐藏的时序信息;
19、s203、利用残差网络的跳跃连接处理混合深度神经网络模型的退化问题;
20、s204、利用全连接层,对得到的隐藏时序信息进行融合,学习特征表示与真值之间的映射关系,完成对各子域隐藏知识的提取,以实现从源项目数据中提取待转移的知识。
21、上述进一步方案的有益效果是:该混合深度神经网络模型在捕获源项目时间维度、空间维度信息的同时,能够避免网络退化,进而实现源项目丰富知识的有效提取,便于知识的转移和复用。
22、再进一步地,所述步骤s3包括以下步骤:
23、s301、基于混合深度神经网络模型,通过获取若干个子域知识提取模型,得到第e个子域知识提取模型的回归损失;
24、s302、冻结子域知识提取模型的特征提取器参数,将其迁移至目标域上,其中,基于第e个子域知识提取模型的特征提取器,通过分别提取目标域的第e组深层特征表示,得到各子域与目标域的高级特征表示的分布差异知识;
25、s303、根据回归损失和分布差异知识,得到多知识融合的特征提取器,并输入目标域的训练数据,得到多知识特征融合后的高级特征表示;
26、s304、在多知识融合的特征提取器后拼接全连接层,作为目标项目预测任务的回归器,并基于多知识融合的特征提取器和回归器,构建目标项目的预测模型;
27、s305、根据多知识特征融合后的高级特征表示,对目标项目的预测模型进行微调,并利用经微调后的目标项目预测模型,得到目标项目数据,完成工程装备知识跨项目的转移。
28、上述进一步方案的有益效果是:一方面,域特殊知识包含了各个子域知识提取模型对子域的学习能力,即子域知识提取模型对参数变量与预测变量的解释能力。当子域知识提取模型能够很好地拟合源项目上的预测变量时,子域知识提取模型所提取的域特殊知识应该被转移。另一方面,域分布知识反映了子域内部数据的分布情况,基于此可以得到多对子域和目标项目的分布差异值。当域对(源域的一个子域与目标域构成一个域对)的分布差异较小时,说明子域所提取到的知识能够更好地适用于目标项目的任务。总而言之,通过同手利用各个子域的域特殊知识、子域和目标域的分布知识,采用知识融合权重对多个子域的知识提取模型进行融合,可以使融合模型更加适应目标项目。
29、再进一步地,所述第e个子域知识提取模型的回归损失的表达式如下:
30、dist_rege=∑|pe-ye|
31、pe=rse(fsxe;θrse)
32、
33、其中,dist_rege表示第e个子域知识提取模型的回归损失,pe表示第e个子域知识提取模型的回归器的输出值,ye表示第e个子域的真实值,rse()表示第e个子域知识提取模型的回归层,fsxe表示第e个子域知识提取模型的特征提取器提取到的第e个子域的深层特征表示,θrse表示第e个子域知识提取模型的回归层的训练参数,fee()表示子域知识提取模型的特征提取器,sxe表示第e个子域知识提取模型的第e个子域的输入值,表示第e个子域知识提取模型的特征提取器的训练参数。
34、上述进一步方案的有益效果是:针对数据维度高、时序性强的施工数据,通过采用所构建的知识提取模型,可以充分挖掘到数据中所隐藏的空间信息、时序信息,从而实现知识的充分提取,有利于后续过程中知识的转移与复用。
35、再进一步地,所述各子域与目标域的高级特征表示的分布差异知识的表达式如下:
36、dist_de=mmd(fsxe',ftxe)
37、
38、其中,dist_de表示第e个子域知识提取模型的特征提取器所提取到的第e个子域与目标域的高级特征表示的分布差异知识,mmd()表示mmd距离度量,fsxe'表示第e个子域知识提取模型所提取的第e个子域的特征表示,ftxe表示第e个子域知识提取模型所提取的目标域的特征表示,txe表示第e个子域知识提取模型的目标域的输入值,表示第e个子域知识提取模型的特征提取器的训练参数。
39、上述进一步方案的有益效果是:通过采用mmd距离来度量第e个子域和目标域的特征表示的距离,能够反映出二者的距离分布差异,从而更好地为后续步骤中的多知识特征融合提供关键指导。
40、再进一步地,所述多知识特征融合后的高级特征表示的表达式如下:
41、ftx=add(ftx'1,ftx'2,...,ftx'e;θadd)
42、ftx'e=multiply(we,ftxe;θmul)
43、
44、其中,ftx表示多知识特征融合后的高级特征表示,add()表示深度学习中的add神经网络层,具有向量加和的作用,ftx'e表示we和ftxe经过multiply层处理之后的输出结果,θmul和θadd分别表示multiply层和add层的训练参数,multiply()表示深度学习中的multiply神经网络层,具有矩阵乘积的作用,we表示第e个子域知识提取模型的特征提取器的融合权重,ftxe表示第e个子域知识提取模型所提取的目标域的特征表示,minmaxscaler()表示对所选内容归一化操作。
45、上述进一步方案的有益效果是:域特殊知识反映了子域知识提取模型对于参数变量与预测变量的解释能力,域分布知识反映了子域和目标项目之间的分布差异值。基于各个子域的域特殊知识、子域和目标域的分布知识,所得到的融合模型将在目标项目上取得更为优异的成绩。
46、再进一步地,所述步骤s305具体为:
47、根据多知识特征融合后的高级特征表示,利用下式,对目标项目的预测模型进行微调,并利用经微调后的目标项目预测模型,得到目标项目数据,完成工程装备知识跨项目的转移:
48、pt=rt(ftx;θrt)
49、其中,pt表示目标项目预测模型的输出值,rt()表示作为目标项目预测任务的回归器,θrt表示多知识融合的知识提取模型的回归层的训练参数。
50、上述进一步方案的有益效果是:通过采用基于目标项目预测模型的微调方式,不仅将保留来自多个子域所取得的通用性知识,还将新增来自目标域的特殊性知识,从而使得该融合预测模型更加适应于目标项目,在目标任务上表现出良好的泛化性能。
51、本发明提供了一种工程装备知识跨项目转移系统,包括:
52、源项目时序分块模块,用于利用改进的时序分块算法,将源项目数据划分为最具分布多样性的多个子域;
53、源项目知识提取模块,用于利用混合深度神经网络模型,提取对各子域隐藏知识,以实现从源项目数据中提取待转移的知识;
54、基于多知识的特征融合模块,用于利用多知识的特征融合方法,融合提取的各子域隐藏知识,得到目标项目数据,完成工程装备知识跨项目的转移。
55、本发明的有益效果是:为减小工程装备知识跨项目转移的噪声,充分提取可用工程装备知识,同时通过利用多类知识来增强跨项目知识在目标项目上的适应性,本发明将完工项目(或积累数据多的项目)作为源项目数据,从其施工数据中学到潜在影响因素和预测变量之间的映射关系,即可转移的项目知识,并将其用于在建项目(目标项目)的预测任务,精准预测未来某时间间隔的盾构机姿态位置偏差,解决现有知识转移方法没有考虑去除源域数据、由于数据分布差异所带来的噪声,在融合结果时也没有同时利用多类知识使得模型更适应于目标域的数据的技术问题,有效地实现工程装备知识的跨项目转移。
本文地址:https://www.jishuxx.com/zhuanli/20241021/320978.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。