一种企业级碳排放预测方法及其系统与流程
- 国知局
- 2024-08-08 16:58:25
本发明涉及碳排放预测,尤其是涉及一种企业级碳排放预测方法及其系统。
背景技术:
1、随着全球气候变化的日益严重,减少碳排放已成为当前可持续发展的重要目标之一,也是当前亟待解决的问题。为了减少碳排放,需要准确的进行碳排放预测,这不仅有助于及时发出警告,避免碳排放超标,还有助于碳排放者提前规划碳排放交易,加快能源转型。
2、目前已有很多研究工作尝试进行碳排放预测,它们大多利用统计学习方法或机器学习方法预测一个地区未来的碳排放量,从而及时调整地区层面的碳排放决策。然而,现有的碳排放预测方法存在以下局限性:1)数据颗粒度过粗。传统的碳排放方法通常使用宏观层面的数据源,如国家、区域和园区层面的统计局数据。很难用于调整微观碳排放者(如具体企业)的碳排放量。2)碳排放调整反馈慢。由于这些宏观数据的收集、汇总、生成报告和决策需要大量时间,对碳排放的实时波动不敏感。这种滞后性削弱了其指导实时碳排放政策调整的能力。3)考虑的碳排放因素少。实际碳排放主体的排放行为可能受到多种因素的影响。仅使用少数碳排放指标往往会导致预测结果较差。基于同样的原因,通常需要对数据分布等进行假设,很难构建出一个通用模型。4)数据规模小。对于数据驱动模型而言,利用宏观数据源进行碳排放预测的准确性受到数据规模的限制。
技术实现思路
1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种企业级碳排放预测方法及其系统,能够准确预测细颗粒的碳排放数据。
2、本发明的目的可以通过以下技术方案来实现:一种企业级碳排放预测方法,包括以下步骤:
3、s1、采集多家企业的多维数据,通过预处理和特征提取操作,得到时间序列数据及影响碳排放的主要因子;
4、s2、针对时间序列数据进行分段处理,得到训练数据和测试数据;
5、s3、构建xgboost模型,利用训练数据和测试数据进行模型训练和测试,得到碳排放预测模型;
6、s4、获取待预测企业的多维数据,并通过预处理和特征提取操作得到待预测企业的时间序列数据,将待预测企业的时间序列数据输入碳排放预测模型,输出得到相应的碳排放预测结果。
7、进一步地,所述步骤s1具体是通过爬虫方式采集多家企业的多维数据。
8、进一步地,所述多维数据包括多个维度的财务数据和季度碳排放量数据。
9、进一步地,所述预处理和特征提取操作的过程包括:
10、将企业的多维数据进行异常值检测和整合处理,得到具有完整信息的高维度初步数据;
11、针对高维度初步数据进行降维处理和因子分析,生成具有n个维度的数据集、并确定出影响碳排放的主要因子;
12、针对n个维度的数据集进行滑窗操作,得到时间序列数据。
13、进一步地,所述异常值检测具体是采用箱型图和3σ方法来检测每一维度财务数据的异常值。
14、进一步地,所述异常值检测的公式为:
15、下内限:liq=q1-1.5·iqr;
16、上内限:uiq=q3-1.5·iqr;
17、下界:low=3-σ·ratio+liq·(1-ratio);
18、上界:high=3-σ·ratio+uiq·(1ratio);
19、其中,ratio=0.3,liq为下内限,uiq为上内限,low为下限,high为上限。
20、进一步地,所述降维处理和因子分析具体是采用逐步回归方法,即利用皮尔逊相关系数作为衡量指标,以对高维度初步数据进行降维、并提取出主要因子。
21、进一步地,所述主要因子与碳排放数据之间的关联度大于预设关联阈值。
22、进一步地,所述滑窗操作采用的时间滑动窗口的长度为4,即以公司当年四个季度的历史数据作为预测下一季度数据的数据窗口。
23、一种企业级碳排放预测系统,包括数据采集模块、异常值处理与整合模块、降维模块、滑窗模块、预测模块,所述数据采集模块用于采集多个企业日常经营场景下的多维数据;
24、所述异常值处理与整合模块用于处理多维数据中的异常值,得到无异常值的高维度初步数据;
25、所述降维模块用于对高维度初步数据特征进行降维及因子分析,生成具有n个维度的数据集、并确定出影响碳排放的主要因子;
26、所述滑窗模块用于将n维数据处理为时间序列数据;
27、所述预测模块用于将时间序列数据输入至预先训练好的碳排放预测模型中,输出待测企业未来单季度的碳排放数据。
28、与现有技术相比,本发明具有以下优点:
29、本发明通过采集多家企业的多维数据,结合预处理和特征提取操作,以得到时间序列数据及影响碳排放的主要因子;再针对时间序列数据进行分段处理,以得到训练数据和测试数据;并通过构建xgboost模型,利用训练数据和测试数据进行模型训练和测试,以得到碳排放预测模型,用于预测企业未来单季度的碳排放数据。由此将更多可能影响企业碳排放的因素纳入考虑范围并进行整合,能够解决企业级碳排放数据稀缺的问题,将企业的相关数据作为参考的变量,为碳排放量预测提供精确的企业信息,从而准确预测细颗粒的碳排放数据。
30、本发明通过爬虫方式采集多家企业的多维数据,包含企业碳排放数据以及企业财务数据;其中,企业碳排放数据为企业季度碳排放量数据;财务数据则包括营业总收入、负债合计、净利润以及营业外支出等686个维度的数据。由此建立了一个大规模的企业级碳排放预测数据集,提升了数据颗粒度,能够便捷高效地采集数据,同时有利于后续训练得到碳排放预测模型的可靠性。
31、本发明将企业碳排放数据和财务数据进行异常值处理和整合,以确定高维度初步数据,再采用逐步回归法来进行降维和因子分析,以实现基于因子分析的碳排放特征提取,即确定出影响该企业碳排放的主要因子,能够为不同类型的企业建立通用的碳排放预测模型。
技术特征:1.一种企业级碳排放预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种企业级碳排放预测方法,其特征在于,所述步骤s1具体是通过爬虫方式采集多家企业的多维数据。
3.根据权利要求1所述的一种企业级碳排放预测方法,其特征在于,所述多维数据包括多个维度的财务数据和季度碳排放量数据。
4.根据权利要求3所述的一种企业级碳排放预测方法,其特征在于,所述预处理和特征提取操作的过程包括:
5.根据权利要求4所述的一种企业级碳排放预测方法,其特征在于,所述异常值检测具体是采用箱型图和3σ方法来检测每一维度财务数据的异常值。
6.根据权利要求5所述的一种企业级碳排放预测方法,其特征在于,所述异常值检测的公式为:
7.根据权利要求4所述的一种企业级碳排放预测方法,其特征在于,所述降维处理和因子分析具体是采用逐步回归方法,即利用皮尔逊相关系数作为衡量指标,以对高维度初步数据进行降维、并提取出主要因子。
8.根据权利要求7所述的一种企业级碳排放预测方法,其特征在于,所述主要因子与碳排放数据之间的关联度大于预设关联阈值。
9.根据权利要求4所述的一种企业级碳排放预测方法,其特征在于,所述滑窗操作采用的时间滑动窗口的长度为4,即以公司当年四个季度的历史数据作为预测下一季度数据的数据窗口。
10.一种基于如权利要求1所述企业级碳排放预测方法的企业级碳排放预测系统,其特征在于,包括数据采集模块、异常值处理与整合模块、降维模块、滑窗模块、预测模块,所述数据采集模块用于采集多个企业日常经营场景下的多维数据;
技术总结本发明涉及一种企业级碳排放预测方法及其系统,该方法包括:采集多家企业的多维数据,通过预处理和特征提取操作,得到时间序列数据及影响碳排放的主要因子;针对时间序列数据进行分段处理,得到训练数据和测试数据;构建XGBoost模型,利用训练数据和测试数据进行模型训练和测试,得到碳排放预测模型;获取待预测企业的多维数据,并通过预处理和特征提取操作得到待预测企业的时间序列数据,将待预测企业的时间序列数据输入碳排放预测模型,输出得到相应的碳排放预测结果。与现有技术相比,本发明能够解决企业级碳排放数据稀缺的问题,准确预测细颗粒的碳排放数据。技术研发人员:薛广涛,王然,方楠,汤敬华,裴禹乔,杨岚青受保护的技术使用者:上海声通信息科技股份有限公司技术研发日:技术公布日:2024/8/5本文地址:https://www.jishuxx.com/zhuanli/20240808/271554.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表