技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于人工智能的新闻数据的知识图谱构建方法与流程  >  正文

一种基于人工智能的新闻数据的知识图谱构建方法与流程

  • 国知局
  • 2024-07-31 22:59:57

本申请涉及数据治理,特别是涉及一种基于人工智能的新闻数据的知识图谱构建方法、电子设备及存储介质。

背景技术:

1、传统的基于人工智能的新闻数据的知识图谱构建方法,包括从新闻数据产生到入库的人工筛选、标引和分类等步骤,以及新闻数据保存入库后对新闻数据的简单的关键词检索招回。然而这种治理方法忽略了新闻数据深层的语义信息,也忽略了新闻数据之间可能存在的关联,导致新闻数据的治理效果差,智能化不足。

技术实现思路

1、为了解决现有技术存在的不足,本申请的目的在于提供一种基于人工智能的新闻数据的知识图谱构建方法、电子设备及存储介质,提高新闻数据的治理效果。

2、为实现上述目的,本申请提供一种基于人工智能的新闻数据的知识图谱构建方法,包括:

3、建立新闻数据资源库;

4、基于所述新闻数据资源库的新闻数据,训练生成用于识别新闻实体的命名实体模型;

5、响应于对历史新闻的处理,根据对应的标签以及结构化数据生成节点实体和实体关系存储到neo4j图数据库形成新闻知识图谱的基础部分;

6、响应于对实时新闻的处理,使用所述命名实体模型和大语言模型分别对实时新闻进行新闻实体的识别和提取,综合得到包括若干新闻实体的识别结果;

7、使用大语言模型分析,抽取识别到的新闻实体间的相应关系,对所述新闻实体间的相应关系进行加权评分,作为新闻实体间的关系类型;

8、基于识别到的新闻实体及新闻实体间的关系类型,构建新闻知识图谱并保存。

9、进一步的,所述新闻实体包括:新闻节点实体、人物节点实体、组织节点实体、地点节点实体和事件节点实体。

10、进一步的,所述关系类型包括:主题与事件关系、事件与时间关系、事件与地点关系、事件与地点关系、人物与组织关系、人物与事件关系、组织与事件关系、地点与事件关系、新闻来源与新闻关系、新闻分类与新闻关系,以及评价关系。

11、进一步的,所述方法还包括:

12、基于所述新闻数据资源库的新闻数据,训练生成用于确定新闻所属类别的文本分类模型;

13、基于所述新闻数据资源库的新闻数据,训练生成用于确定新闻的情感倾向的新闻情感分类模型。

14、进一步的,所述命名实体识别模型基于条件随机场训练生成。

15、进一步的,所述方法还包括:

16、基于新闻中识别出的实体,查询新闻知识图谱数据库与所述实体直接或间接的其他相关实体,分析实体之间的关系路径,生成背景信息。

17、进一步的,所述方法还包括:

18、将新闻中识别出的实体与新闻知识图谱中的实体节点进行匹配查询,找到对应的实体及其在图谱中的相关信息,生成实时新闻推荐扩展。

19、进一步的,所述方法还包括:

20、响应于对新闻的浏览,从新闻知识图谱中获取的实体的背景信息融入到原始新闻内容中。

21、进一步的,所述新闻数据资源库包括纸媒数据库、新媒体内容库、数字产品资源库、用户数据库和全网数据源库

22、为实现上述目的,本申请提供的电子设备,包括:

23、处理器;

24、存储器,其上存储有一个或多个在所述处理器上运行的计算机程序指令;

25、其中,所述处理器运行所述计算机指令时,执行如上所述的一种基于人工智能的新闻数据的知识图谱构建方法。

26、为实现上述目的,本申请提供的计算机可读存储介质,其上存储有计算机指令,当计算机指令被处理器运行时,执行如上所述的一种基于人工智能的新闻数据的知识图谱构建方法的步骤。

27、本申请提供的一种基于人工智能的新闻数据的知识图谱构建方法,通过建立新闻数据资源库,训练生成命名实体模型对新闻进行实体识别,进而建立新闻知识图谱,能够高效治理新闻数据的同时,有利于提高新闻的质量和可读性。

28、本申请提供的一种基于人工智能的新闻数据的知识图谱构建方法,通过文本分类模型和新闻情感分类模型对新闻进行分类,进而建立玩更多维度的知识图谱,扩大了新闻数据的治理维度和提高了新闻数据的质量和可靠性。

29、本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。

技术特征:

1.一种基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述新闻实体包括:新闻节点实体、人物节点实体、组织节点实体、地点节点实体和事件节点实体。

3.根据权利要求1所述的基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述关系类型包括:主题与事件关系、事件与时间关系、事件与地点关系、事件与地点关系、人物与组织关系、人物与事件关系、组织与事件关系、地点与事件关系、新闻来源与新闻关系、新闻分类与新闻关系,以及评价关系。

4.根据权利要求1所述的基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述方法还包括:

5.根据权利要求1所述的基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述命名实体识别模型基于条件随机场训练生成。

6.根据权利要求1所述的基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述方法还包括:

8.根据权利要求1所述的基于人工智能的新闻数据的知识图谱构建方法,其特征在于,所述新闻数据资源库包括纸媒数据库、新媒体内容库、数字产品资源库、用户数据库和全网数据源库。

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,当计算机指令运行时执行权利要求1-8任一项所述的基于人工智能的新闻数据的知识图谱构建方法的步骤。

技术总结本申请涉及数据治理技术领域,特别是涉及一种基于人工智能的新闻数据的知识图谱构建方法、电子设备及存储介质。所述方法包括:建立新闻数据资源库;训练生成命名实体模型;响应于对历史新闻的处理,生成节点实体和实体关系存储到Neo4J图数据库形成新闻知识图谱的基础部分;响应于对实时新闻的处理,使用命名实体模型和大语言模型分别对实时新闻进行新闻实体的识别和提取;使用大语言模型分析,抽取识别到的新闻实体间的相应关系,对所述新闻实体间的相应关系进行加权评分,作为新闻实体间的关系类型;基于识别到的新闻实体及新闻实体间的关系类型,构建新闻知识图谱并保存。本申请的知识图谱构建方法,新闻数据的治理效果好。技术研发人员:高岩,莫正荣,阮剑,高猛受保护的技术使用者:苏州日报社技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/195646.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。