一种基于区块链的工程项目预算预测方法
- 国知局
- 2024-07-31 23:06:20
本发明属于机器学习,涉及了一种基于区块链的工程项目预算预测方法。
背景技术:
1、随着全球经济的发展和城市化进程的加快,建筑工程项目的数量和规模都在迅速增长。这些项目往往涉及复杂的设计、多样的建材和不同程度的人力资源需求,再加上市场价格波动、政策调整以及自然环境的影响,使得工程项目预算的制定和管理变得极为复杂和挑战性。传统的预算预测方法主要依靠专家经验和历史数据分析,这种方法在处理大规模、复杂数据时往往力不从心,无法充分考虑所有影响预算的因素,导致预算超支现象频发,不仅增加了项目成本,也给项目参与方带来了巨大的经济风险。
2、中国专利(申请号:cn202310316917.1)提出了一种业务预算评估方法、系统、终端设备及存储介质。通过获取业务项目的具体运行数据,并对该运行数据进行分析整理后获得该项目的子项目,基于子项目进行采集市场对运行成本的报价,并对该报价进行评估得到最优报价,以最优报价作为成本进行计算利润空间,并设定预期利润阈值,将预期利润阈值作为基础值,在项目运营期间根据最优报价的变化进行调整利润空间,以利润空间的变化来判断业务的支出预算,可以在项目运行期间进行重新估算支出,整个评估过程简单准确,对预算编制的全过程处理清晰,有效的提高预算工作效率;中国专利(申请号:cn202310656978.2)提出了一种建筑材料工程项目预算测量装置、系统和方法,属于建筑工程装置领域,其中测量装置包括;支撑模块,安装模块,采集模块,记录模块,控制模块,散热模块,计算模块,显示模块。支撑模块,用于可升降的支撑信息采集设备;安装模块,用于承载采集模块和记录模块;采集模块,包括摄像头、传感器,用于对建筑工程现场信息的监测;记录模块,包括usb接口,用于数据的导入和存储;散热模块,包括散热器和滤网;计算模块,以采集模块采集的数据以及usb导入数据采用基于混沌遗传-狮群算法优化bp神经网络对数据进行计算预测;显示模块,包括显示屏,实现采集信息的图形化显示。本发明避免了因长时间户外作业装置过热导致装置损毁、方便了数据交换与数据共享,并提高了工程预算精度;中国专利(申请号:cn202310656978.2)提出了一种基于成本联动的工程项目进度预测分析方法,包括提取目标铁路项目对应各建造标段的相关建造数据和工程进度跟踪表;分析各建造标段的成本控制符合度和时间控制符合度;设定各建造标段对应进度评估修正因子,并统计各建造标段当前施工进度符合度;预测各建造标段对应进度达成类型,进而确认各协调标段对应的目标辅助标段,并反馈至各协调标段对应进度管理人员;本发明有效解决了当前对成本层面数据分析力度不高的问题,打破了当前项目进度预测方式存在的局限性,确保了项目进度预测结果的合理性,为后续各建造标段施工计划的优化提供了可靠的决策性的建议;总体来讲,其缺点是:1、现有技术在处理大规模、复杂的工程项目数据时存在明显的局限性,特别是在数据采集和预处理阶段,缺乏高效的方法来处理和标注大量的数据,导致预算预测模型难以充分学习到数据中的复杂模式和关联,影响预测的准确性和可靠性;2、由于缺乏有效的数据扩充和增强方法,现有的预算预测模型往往在训练数据有限时表现不佳,容易过拟合,泛化能力弱;3、现有技术在特征提取和降维方面通常采用较为传统的方法,难以有效地从高维复杂数据中提取出对预算预测有价值的信息;4、由于缺乏高效和准确的分类器训练方法,现有技术在预算预测的准确性和计算效率方面仍有较大的提升空间;5、在数据的存储和管理方面,现有技术往往忽视了数据安全性和透明度的重要性。
技术实现思路
1、针对上述问题,本发明目的是提出了一种基于区块链的工程项目预算预测方法。
2、技术方案:本发明所述的一种基于区块链的工程项目预算预测方法;其操作步骤如下:步骤(1):数据采集与标注;步骤(2):数据扩充;步骤(3):特征提取模型训练;步骤(4):特征降维模块训练;步骤(5):分类器训练;步骤(6):区块链存储。
3、进一步的,在步骤(1)中,在所述数据采集与标注中,数据采集的具体方式是:通过对历史工程项目数据的分析进行工程项目预算预测,预测未来工程项目的预算需求,其数据来源于历史工程项目的记录,其中的数据向量表示为:
4、a=[ax,ay,az,…,a10]
5、式中,ax表示项目规模;ay表示预计工期;az表示地理位置的经纬度编码;a4表示工程类型,以编码形式表示不同的工程类型;a5表示预算总额;a6表示实际支出;a7表示使用材料的类型;a8表示环境影响评估指数;a9表示人力资源需求量;a10表示技术难度系数,根据项目实施中的技术挑战评估而得;
6、对采集到的数据进行标注时,其标注方式为人工标注所述标注的类别包括超预算、预算内及低于预算3个类别。
7、进一步的,在步骤(2)中,所述数据扩充是:基于运筹学中的排队理论优化的生成对抗网络算法,将运筹学中的排队理论应用于生成对抗网络的训练过程中,通过模拟工程项目数据生成过程中的排队现象,优化生成器和判别器的训练策略;通过采用记忆化搜索机制,对损失函数进行改进,确保生成的数据多样性;具体的,基于运筹学中的排队理论优化的生成对抗网络算法的训练流程如下:
8、(一)、初始化生成器和判别器的网络参数:生成器负责生成虚拟的工程项目数据,判别器的任务是区分生成的数据和真实的工程项目数据;具体的,设生成器和判别器的参数分别由向量bg和bd表示,初始时刻,这两个向量通过随机过程进行初始化,表示为:
9、
10、
11、式中,表示均值为0,协方差为单位矩阵i的多变量正态分布;
12、(二)、在每一轮训练中,生成器根据当前网络参数和排队理论的优化策略,生成一批虚拟工程项目数据;根据排队理论,模拟工程项目数据生成和评审过程中的自然延时和资源分配问题,以优化生成数据的质量和多样性;具体的,生成器的数据生成过程表示为:
13、xg=fg(z;bg)
14、
15、式中,xg表示生成的数据,fg是生成器的网络函数,z是从多变量正态分布中抽取的噪声向量;
16、(三)、判别器评估真实数据和生成数据,并计算损失;具体的,设在第t次迭代中,记忆集合用于存储这些特征,判别器的损失函数ld表示为:
17、
18、式中,fd是判别器的网络函数,xj是真实数据,β是记忆化搜索项的权重系数,‖‖2表示欧氏距离的平方;
19、(四)、根据损失函数的结果,通过反向传播算法更新生成器和判别器的参数;具体的,对于生成器和判别器的参数更新方式表示为:
20、
21、
22、式中,ηg和ηd分别是生成器和判别器的学习率,和分别是损失函数lg和ld关于bg和bd的梯度;
23、(五)、重复步骤(二)至步骤(四),直到达到最大迭代次数。
24、进一步的,在步骤(二)中,根据排队理论,定义排队模型式中,λ是到达率,μ是服务率;
25、在每次迭代中,调整生成器的参数bg,以最小化等待时间wq和系统中顾客数量lq的期望值,从而优化数据生成过程,该优化问题表示为:
26、
27、约束条件为:λ<μ
28、式中,α是平衡两个目标的权重系数;到达率λ设置为10个数据点/小时,服务率μ被设置为12个数据点/小时,α被设置为0.5;
29、等待时间的期望值e[wq]通过到达率λ和服务率μ计算得到,表示为:
30、
31、系统中顾客数量的期望值e[lq]同样根据到达率和服务率计算得到,表示为:
32、
33、在步骤(三)中,记忆化搜索项为所有记忆中数据与当前生成数据之间差异的平方和,表示为:
34、
35、式中,是在第t次迭代中的记忆集合,包含了之前迭代中由生成器产生的数据;
36、在步骤(四)中,学习率ηg和ηd通过自适应调整的方式设置,自适应学习率调整对于每次迭代,学习率的调整基于前一步的损失变化量进行,表示为:
37、
38、
39、式中,δ是学习率调整的敏感度参数,和分别是生成器和判别器损失函数在第t次迭代的变化量;sign是符号函数,用于确定损失是增加或减少,从而相应地调整学习率。
40、进一步的,在步骤(3)中,所述特征提取模型训练具体是:将扩充后的样本输入到特征提取模型中进行特征提取模型的训练,其采用3层的全连接神经网络进行特征提取;具体的,涡动优化神经网络算法的训练流程如下:(一)、在参数空间中随机生成一组涡旋,每个涡旋代表一个参数配置,具体的,定义神经网络参数向量pi=(wi,bi),其中i是涡旋索引;
41、在初始化过程中,每个涡旋的参数向量pi是在参数空间中随机生成的,符合均匀分布,设定初始涡旋总数为n,则初始化过程表示为:
42、
43、式中,表示均匀分布,a和b是参数空间的下界和上界,由人为预设;
44、(二)、计算每个涡旋代表的参数配置在训练集上的性能,根据性能对涡旋进行排序;具体的,性能评估使用损失函数l(pi)来完成,评估完成后,涡旋根据损失函数的值进行排序:
45、l(p1)≤l(p2)≤…≤l(pn)
46、损失函数l(pi)是交叉熵损失;
47、(三)、进行涡旋动态更新,根据涡旋的排名和相互之间的距离,动态调整涡旋的位置和强度,模拟涡旋的相互作用和演变过程;具体的,在涡旋动态更新阶段,模拟涡旋的相互作用调整其在参数空间中的位置,设定涡旋i和j之间的距离为dij=∥pi-pj∥,则第i个涡旋的更新量δpi表示为:
48、
49、式中,γ是调节距离影响的超参数,f(dij)是基于距离的调节函数,λb是自适应漩涡因子,ξi为基于环境反馈的调节因子;
50、(四)、模拟自然界涡旋的合并与分裂现象,以促进解空间的多样性和探索新的参数区域;具体的,设合并阈值tm和分裂阈值ts,当两个涡旋之间的距离小于tm时,会合并成一个新的涡旋;当一个涡旋的强度超过ts时,会分裂成两个涡旋;其合并操作表示为:
51、
52、式中,l(pi)和l(pj)是涡旋i和涡旋j对应的损失函数值;且,分裂操作表示为:
53、pi1=pi+δq
54、pi2=pi-δq
55、式中,δq是基于涡旋i参数向量的随机扰动向量,用于生成两个新涡旋的参数;
56、(五)、选取表现最好的涡旋,进行局部搜索以精细调整其参数,模拟涡旋在流体中的局部吸收和能量集中现象;对于表现最好的涡旋,执行局部搜索以进一步精细调整其参数,通过基于领域的搜索策略实现;具体的,设基于领域的搜索的策略中,局部搜索的方式表示为:
57、
58、式中,ηm是学习率,是以0为均值,σloc为协方差矩阵的高斯分布,用于生成参数的随机扰动;
59、(六)、进行涡旋衰减,模拟自然界中涡旋能量的消散过程;具体的,衰减过程通过调整涡旋的生命值来实现,生命值低于某个阈值的涡旋将被淘汰,设定涡旋i的生命值为li,衰减规则为:
60、
61、式中,为衰减后的生命值,δl是生命值的减少量;
62、(七)、重复步骤(二)至(六),直到达到预设的最大迭代次数;每一轮迭代后,都更新涡旋的状态,并重新评估其性能,以确保算法向着最优解进步。
63、进一步的,在步骤(三)中,基于距离的调节函数f(dij)的计算方式利用指数衰减模型来反映涡旋间相互作用力随距离增加而减弱的特性,表示为:
64、f(dij)=αqexp(-βqdij)
65、式中,αq和βq是超参数,控制作用力的幅度和衰减速率;
66、dij代表涡旋i和涡旋j之间的距离,根据两个涡旋代表的参数向量的欧几里得距离计算得到,表示为:
67、
68、式中,d是参数向量的维度,pik和pjk分别是涡旋i和涡旋j在第k维的参数值;
69、自适应漩涡因子λb采用自适应涡旋引导学习的方式计算得到,定义涡旋分布的信息熵h为:
70、
71、式中,pi是第i个涡旋在所有涡旋中占的比重,通过涡旋的损失函数的倒数计算得到,表示为:
72、
73、根据信息熵的变化,自适应漩涡因子λb用于调节涡旋的搜索策略,计算方式表示为:
74、
75、式中,κ是一个预设的最大调节强度,hmax是理论上达到的最大信息熵值,表示完全均匀分布的状态。μi为动量调整因子,mi为涡旋i在最近t次迭代中的平均动量向量;动量调整因子μi和平均动量向量mi通过时间序列动量调整得到,时间序列动量调整旨在通过分析涡旋在参数空间中的历史移动趋势来调整其探索动向,考虑涡旋在历史迭代中的移动方向和速度,计算其动量,然后利用这一动量信息来指导未来的参数更新;具体的,计算涡旋i在最近t次迭代中的平均动量向量mi表示为:
76、
77、式中,是涡旋i在第t次迭代后的参数向量,是第t-1次迭代后的参数向量;
78、定义动量调整因子μi用于衡量动量的大小和一致性,表示为:
79、μi=∥mi∥·cos(θi)
80、式中,θi是mi和之间的夹角,用于衡量最新移动方向与平均动量方向的一致性,且夹角越小表示动量越一致;基于环境反馈的调节因子的计算方式表示为:
81、ξi=sig(e(pi))
82、式中,sig()是sigmoid映射函数,将环境反馈映射到(0,1)区间;e(pi)为环境反馈函数,其用于评估涡旋i周围环境的特性,计算方式表示为:
83、
84、式中,是涡旋i位置处损失函数的hessian矩阵,是梯度的模;
85、在步骤(四)中,随机扰动向量δ基于当前涡旋位置的局部梯度信息生成,以增加搜索过程的随机性和探索性,计算方式表示为:
86、
87、式中,ζq和εq是控制梯度方向和随机扰动强度的超参数,g代表在涡旋位置pi处计算得到的梯度信息,是均值为0,协方差矩阵为的高斯噪声;
88、在步骤(五)中,协方差矩阵σloc根据涡旋在参数空间中的历史移动方向和速度动态调整,以适应不同的搜索阶段和特性,其更新策略表示为:
89、
90、其中,为调整后的协方差矩阵,为调整前的协方差矩阵,ρn是学习率参数,用于控制历史信息对当前搜索的影响程度。
91、进一步的,在步骤(4)中,所述特征降维模块训练具体是:将特征提取后的数据输入到特征降维模块中进行训练;具体的,基于逆向强化学习的自编码神经网络算法的训练流程如下:(一)、初始化自编码器的权重和参数,包括编码器和解码器的权重,以及逆向强化学习和自适应采样优化算法的相关参数;具体的,定义ex为输入数据向量,ez为编码器输出的低维特征表示,ewe、ewd为分别代表编码器和解码器的权重矩阵,ebe、ebd为分别代表编码器和解码器的偏置项;ey为解码器重建的输出,旨在近似输入ex;l(ey,ex)为重建误差,用于衡量ey和ex之间的差异;r(ez)为逆向强化学习中的奖励函数,用于评估低维特征表示ez的质量;α、β为学习率参数;编码器和解码器的权重和偏置项初始化采用小的随机值或者根据某种启发式方法确定,表示为:
92、
93、
94、(二)、在每个训练循环中,将输入数据通过编码器进行特征压缩,获得一个低维的特征表示;具体的,输入数据ex通过编码器转换成低维特征表示ez,表示为:
95、ez=fe(ewe·ex+ebe)
96、式中,fe是编码器的relu激活函数;
97、(三)、根据当前训练的状态,动态调整采样过程中的参数,以优化数据特征的表示;具体的,基于当前的重建误差和奖励函数,动态调整学习率α和β,优化特征表示ez表示为:
98、α,β=adapt(α,β,l(ey,ex),r(ez))
99、式中,adapt()为adapt优化器,自适应采样的优化过程确保关键信息在降维过程中被保留,同时优化算法的收敛速度;设有一个基于当前迭代轮次t和重建误差l(ey,ex)的动态调整机制,对于学习率α和β的调整,以α为例,其调整基于以下方式:
100、α(t)=α0×exp(-γl(ey,ex))
101、式中,α0是初始学习率,γ是一个正的衰减系数;
102、(四)、利用解码器重建数据,并计算重建误差;然后,通过反向传播算法更新编码器和解码器的权重,同时根据逆向强化学习和自适应采样的反馈调整相关参数;具体的,根据解码器重建的输出ey和输入ex的重建误差,更新编码器和解码器的权重和偏置的方式表示为:
103、
104、
105、
106、
107、式中,δewe,δebe,δewd,和δebd分别表示权重和偏置项的更新量;
108、奖励函数r(ez)影响到特征表示ez的学习效果,考虑到ez的目标是精准地表示输入数据ex中的关键信息,奖励函数定义为:
109、r(ez)=-λ∥ez-eztarget∥2
110、式中,eztarget是预期的低维特征表示。λ是一个正的系数,用于平衡重建误差和奖励的影响;
111、(五)、重复步骤(二)至(四),直到达到预设的训练次数。
112、进一步的,在步骤(5)中,所述分类器训练具体是:将降维后的数据输入到分类器中进行分类器的训练;具体的,基于深度确定性策略梯度的极限学习机分类算法的训练流程如下:(一)、定义px为输入极限学习机得到特征向量,pwelm为极限学习机模型的权重;pbelm为极限学习机模型的偏置;pa为深度确定性策略梯度中actor网络的动作输出,即建议的权重调整量;ps为当前状态,基于输入px和极限学习机模型当前的性能;pr为由critic网络评估的奖励,表示当前动作pa的效用;pwactor、pwcritic分别代表actor和critic网络的权重;py为极限学习机模型的输出;初始化极限学习机模型的权重和偏置参数,同时初始化深度确定性策略梯度算法中的actor和critic网络的参数;具体的,极限学习机模型的权重和偏置初始化的方式表示为:
113、
114、深度确定性策略梯度中actor和critic网络的权重初始化方式表示为:
115、
116、(二)、将输入进行预处理,具体的,对输入特征px进行预处理,采用归一化的形式进行预处理,表示为:
117、
118、式中,μpx和σpx分别为px的均值和标准差;
119、计算均值μpx和标准差σpx的方式表示为:
120、
121、
122、式中,n是样本数量,pxi是第i个样本的特征向量;
123、(三)、输入数据通过极限学习机进行前向传播,快速产生分类结果;具体的,极限学习机的输出计算表示为:
124、
125、式中,σ为sigmoid激活函数;
126、(四)、利用深度确定性策略梯度中的actor网络根据当前状态产生一个动作,critic网络评估这个动作的好坏;通过这种方式,算法能够学习如何优化极限学习机的权重设置,以提高预测的准确性;具体的,考虑到当前的输入和极限学习机模型的输出,定义状态ps为:
127、
128、actor网络基于当前状态ps产生动作pa,表示为:
129、pa=actor(ps;pwactor)
130、且,critic网络评估当前动作的奖励pr,表示为:
131、pr=critic(ps,pa;pwcritic)
132、动作pa的产生过程表示为:
133、pa=tanh(actor_net(ps;pwactor))·pamax
134、式中,actor_net代表actor网络的前向传播过程,tanh是激活函数,用于将输出限制在[-1,1]范围内,pamax是动作空间的最大值;且,奖励pr的评估表示为:
135、pr=-(critic_net(ps,pa;pwcritic)-prtarget)2
136、式中,critic_net代表critic网络的前向传播,prtarget是奖励的目标值,通过最小化奖励与目标奖励之间的差异来更新actor和critic网络;
137、(五)、根据深度确定性策略梯度的反馈,更新极限学习机的权重和偏置参数;具体的,迭代步骤(二)至(四),直到达到最大迭代次数;根据深度确定性策略梯度的反馈,更新极限学习机权重和偏置的方式可为:
138、
139、
140、式中,ηp为学习率;
141、模型迭代训练完成后,算法输出每个工程项目的预算预测结果;极限学习机权重和偏置的更新量的计算方式表示为:
142、
143、
144、式中,表示奖励对模型输出的偏导,是通过critic网络反向传播获得的,和分别表示模型输出对权重和偏置的偏导。
145、进一步的,在步骤(6)中,所述区块链存储具体是:将分类器的分类结果和关键数据进行区块链存储,以确保数据的不可篡改性和可追溯性;将预测结果及其关键数据存储到区块链上;整合需要存储的数据,包括分类结果以及项目的关键特征数据,上述数据构成一个数据块,记作dx;对整合后的数据dx进行哈希处理,生成唯一的数据指纹,记作hx,哈希处理可表示为:
146、hx=hash(dx)
147、将哈希后的数据指纹hx以及原始数据dx存储到区块链上;具体的,创建一个新的区块,并将dx和hx作为该区块的内容,然后通过区块链网络的共识机制将其加入到区块链上,区块创建可简化表示为:
148、block=createblock(dx,hx)
149、通过区块链网络中的节点对新创建的区块进行验证,一旦验证通过,区块被添加到链上,数据即被不可篡改地存储;一旦数据被存储在区块链上,任何授权的参与方均可访问这些数据。
150、本发明的有益效果:1、增强的数据质量和多样性:通过排队理论优化的gan和涡动优化算法,本发明有效地提升了数据的质量和多样性,解决了训练样本不足和数据单一性的问题;2、提高模型训练的稳定性和效率:涡动优化神经网络和基于逆向强化学习的自编码神经网络算法的引入,显著提高了模型训练的稳定性和效率;3、提升预测精度:通过深度确定性策略梯度优化的极限学习机,本发明实现了更高的预测精度,特别是在处理复杂的工程项目预算数据时;4、确保数据安全和可信度:利用区块链技术存储预测结果和关键数据,确保了数据的不可篡改性和可追溯性,提升了数据的安全性和透明度。该方法利用最新的信息技术和算法,包括数据采集与标注、数据扩充、特征提取、特征降维以及分类器训练,最终将预测数据存储在区块链上。该方法的核心在于通过智能算法深度挖掘历史数据的内在联系和模式,提高预算预测的准确性和效率,同时利用区块链技术保证数据的安全性和不可篡改性,增强了预测结果的透明度和可信度。
本文地址:https://www.jishuxx.com/zhuanli/20240730/195974.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表