技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于知识图谱的企业可持续发展对标管理方法及系统  >  正文

基于知识图谱的企业可持续发展对标管理方法及系统

  • 国知局
  • 2024-12-06 12:28:44

本发明涉及计算机数据处理,特别是涉及一种基于知识图谱的企业可持续发展对标管理方法及系统。

背景技术:

1、对能源企业来说,对标管理变得愈发重要。现有技术中关于对标管理的方法主要包括pdca循环和apqc基于业务过程的体系架构,并结合平衡记分卡、swot分析和fmea管理程序等工具,然而这些方法和工具并不能准确地预先标注企业可持续发展相关的所有经济、社会和环境方面的指标。此外,能源企业可持续发展相关指标构建的现有研究还比较零散,并且随着社会、经济、环境协同发展需求的不断增加,对标管理过程中不仅需要处理结构化数据,更需要综合利用大量的半结构化和非结构化数据,这些都为能源企业可持续发展的对标管理工作带来了巨大的挑战,传统的方法与工具已经不再适用。

技术实现思路

1、本发明的目的是提供一种基于知识图谱的企业可持续发展对标管理方法及系统,将数据挖掘技术应用于能源企业可持续发展标杆管理,实现了主题挖掘和关系提取技术的联合应用,从而形成科学、全面的指标体系,拓展指标体系对后续工作的指导作用,增强能源企业对标管理的系统性。

2、为实现上述目的,本发明提供了如下方案:一种基于知识图谱的企业可持续发展对标管理方法,具体步骤包括如下:

3、获取企业经营数据;

4、通过lda主题挖掘模型从所述企业经营数据中提取对标指标;

5、利用casre1模型对所述对标指标进行关系抽取分析,得到关系三元组;

6、基于所述对标指标和所述关系三元组构建可视化知识图谱,得到企业对标指标之间的机制关系图。

7、优选的,所述企业经营数据包括企业的年度报告、企业新闻、企业网站、与可持续发展相关的文献数据。

8、优选的,所述lda主题挖掘模型提取所述对标指标的过程为:

9、对于每个主题k,在所有词语v上生成:主题-词分布θ~dir(β),其中β是描述主题-词计数的先验观测值的超参数;

10、对于每个文档d,在所有主题k上生成:文档-主题分布θd-dir(α),其中α是描述文档-主题计数的先验观测值的超参数;

11、对于d中的每个词wi,取样一个主题k~θd和一个词t~φk;

12、其中,在lda主题挖掘模型提取所述对标指标的过程中,由输入部分给定m个文档数据组成语料库d,其中每个文档d具有nd个词(d=1,2,…,m),并涵盖k个主题内容,文档分布用θd表示;每一个主题k由v个词语来混合表征,主题分布用φk表示。

13、优选的,所述casre1模型对所述对标指标进行关系抽取的步骤为:

14、采用主语标记器确定句子中所有可能的主语;

15、针对每个主题利用特定于关系标记器,识别所有可能的关系及相应对象;

16、抽取实体、关系、客体三元组。

17、优选的,采用主语标记器确定句子中所有可能的主语的具体步骤为:

18、计算输入序列中第i个标记识别为主语的开始和结束位置的概率,分别用和表示,如果概率超过设定阈值,则相应的标记将被分配标签1,否则将被分配标签0,其中,xi是输入序列中第i个标记的编码表示,即xi=hn[i],w(·)表示可训练的权重,b(·)表示偏差,σ是sigmoid激活函数;

19、所述主语标记器通过优化似然函数识别给定句子表示的主语s的跨度。

20、优选的,所述似然函数的计算公式为:

21、

22、其中,pθ(s|x)表示似然函数,l表示语句的长度,如果z为真,则i{z}=1,否则为0,是x中第i个标记识别为主语的t位置,表示x中第i个标记的主语起始位置的二进制标记,则表示主语结束位置,表示x中第i个标记识别为主语的t位置的概率,参数θ={wstart,bstart,wend,bend}。

23、优选的,所述抽取实体、关系、客体三元组的过程为:

24、给定来自训练集dt的注释标签语句xj以及语句中一组可能重叠的三元组tj={(s,r,o)},最大化训练集dt的数据似然性:

25、

26、其中,s∈tj表示出现在三元组tj中的主语,tj|s是主语s引导的三元组集合,(r,o)∈tj|s是由主语s引导的三元组中的(r,o)对,r是所有可能关系的集合,r\tj|s表示除主语s引导的其他所有关系,表示空关系对象,即对于给定的主语s,任何与s相关的关系在句子中都有对应的宾语,而其他不相关关系在句子中就没有相对应的宾语,此时记为空关系对象;

27、通过adam随机梯度下降最大化j(θ)来训练模,从而实现对数似然目标j(θ),j(θ)的计算公式为:

28、

29、另一方面,提供一种基于知识图谱的企业可持续发展对标管理系统,包括数据获取模块、指标提取模块、关系提取模块、知识图谱构建模块;其中,

30、所述数据荻取模块,用于获取企业经营数据;

31、所述指标提取模块,用于通过lda主题挖掘模型从所述企业经营数据中提取对标指标;

32、所述关系提取模块,用于利用casre1模型对所述对标指标进行关系抽取分析,得到关系三元组;

33、所述知识图谱构建模块,用于基于所述对标指标和所述关系三元组构建可视化知识图谱,得到企业对标指标之间的机制关系图。

34、根据本发明提供的具体实施例,本发明公开了以下技术效果:提出来新的对标管理方法,通过lda主题挖掘模型确定企业可持续发展的对标指标体系,采用casre1模型训练进行实体、关系、客体三元组的抽取,最后将处理后的结构化的企业可持续发展相关数据进行整合处理,并存入图数据库neo4j中,完成知识图谱的可视化,从而提高对标管理的客观性、全面性及解释性,为企业提供更加直观和有价值的策略建议和提升方案。

技术特征:

1.一种基于知识图谱的企业可持续发展对标管理方法,其特征在于,具体步骤包括如下:

2.根据权利要求1所述的一种基于知识图谱的企业可持续发展对标管理方法,其特征在于,所述企业经营数据包括企业的年度报告、企业新闻、企业网站、与可持续发展相关的文献数据。

3.根据权利要求1所述的一种基于知识图谱的企业可持续发展对标管理方法,其特征在于,所述lda主题挖掘模型提取所述对标指标的过程为:

4.根据权利要求1所述的一种基于知识图谱的企业可持续发展对标管理方法,其特征在于,所述casrel模型对所述对标指标进行关系抽取的步骤为:

5.根据权利要求4所述一种基于知识图谱的企业可持续发展对标管理方法,其特征在于,采用主语标记器确定句子中所有可能的主语的具体步骤为:

6.根据权利要求5所述一种基于知识图谱的企业可持续发展对标管理方法,其特征在于,所述似然函数的计算公式为:

7.根据权利要求4所述一种基于知识图谱的企业可持续发展对标管理方法,其特征在于,所述抽取实体、关系、客体三元组的过程为:

8.一种基于知识图谱的企业可持续发展对标管理系统,其特征在于,包括数据获取模块、指标提取模块、关系提取模块、知识图谱构建模块;其中,

技术总结本发明公开了一种基于知识图谱的企业可持续发展对标管理方法及系统,涉及计算机数据处理技术领域。具体步骤为:获取企业经营数据;通过LDA主题挖掘模型从所述企业经营数据中提取对标指标;利用CasRel模型对所述对标指标进行关系抽取分析,得到关系三元组;基于所述对标指标和所述关系三元组构建可视化知识图谱,得到企业对标指标之间的机制关系图。本发明将数据挖掘技术应用于能源企业可持续发展标杆管理,实现了主题挖掘和关系提取技术的联合应用,从而形成科学、全面的指标体系,拓展指标体系对后续工作的指导作用,增强能源企业对标管理的系统性。技术研发人员:徐小峰,刘文志,唐京茹,王一静,邓忆瑞,陈梦受保护的技术使用者:中国石油大学(华东)技术研发日:技术公布日:2024/12/2

本文地址:https://www.jishuxx.com/zhuanli/20241204/341618.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。