技术新讯 > 计算推算,计数设备的制造及其应用技术 > 面向军事数据的知识图谱自动构建及自适应扩展方法与流程  >  正文

面向军事数据的知识图谱自动构建及自适应扩展方法与流程

  • 国知局
  • 2024-08-19 14:24:18

本发明涉及知识图谱,特别是一种面向军事数据的知识图谱自动构建及自适应扩展方法。

背景技术:

1、知识图谱将互联网的信息表达成更接近人类认知世界的形式,提供了一种更好地组织、管理和理解互联网海量信息的能力。知识图谱给互联网语义搜索带来了活力,同时也在智能问答、大数据分析与决策中显示出强大威力,已经成为互联网基于知识的智能服务的基础设施。知识图谱与大数据和深度学习一起,成为推动人工智能发展的核心驱动力之一。

2、知识图谱平台通过自动知识抽取技术,提取概念、实体和关系,组合成知识网络。知识图谱平台是综合利用数据清洗与解析、自然语言处理、机器学习、智能检索以及知识图谱等技术,拥有构建、存储、应用三大模块的综合性平台。

3、在实现本发明的过程中,发明人发现现有技术至少存在以下问题:

4、针对典型军事领域多源异构数据的知识提取准确度不高、分析挖掘效率低等问题,基于智能应用领域的知识生成、演化与评估技术,实现知识的自动抽取、识别和融合的研究较少,仍需要进一步探索,这也是本发明重点关注的内容。

技术实现思路

1、本发明所要解决的技术问题是针对现有技术的不足,提供一种有助于提高典型军事智能应用领域多源异构数据的知识提取准确度、分析挖掘效率、多源数据综合分析能力的知识图谱自动构建及自适应扩展方法。

2、本发明所要解决的技术问题是通过以下的技术方案来实现的。本发明是一种面向军事数据的知识图谱自动构建及自适应扩展方法,包括以下步骤:

3、(1)建立实体信息抽取模型,提取数据源中的领域概念信息;

4、(2)建立实体关系抽取模型,提取实体之间的数据映射关系;

5、(3)将非结构化军事实体数据推送到事件抽取模型,输出结构化实体事件知识;

6、(4)调用军事数据知识图谱融合接口,消解军事数据冲突,实现军事数据重组,构建军事数据知识图谱;

7、(5)将军事知识图谱数据推送到军事知识图谱推理接口,支撑军事知识图谱知识推理;

8、(6)建立知识图谱智能更新模型,识别出变化的实体并完成更新。

9、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(1)中的实体信息抽取模型包括领域词汇集模型,缩略词挖掘模型,多模态实体模型;

10、领域词汇集模型:支持输入军事文档,输出军事数据标签,用于提取已切分好的词汇,通过分词规则、组合规则、内部凝固度规则、左邻字熵与右邻字熵规则,将军事知识文本语料库转换为军事领域专业词汇,其中,

11、分词规则:以逗号句号等分割符来分割句子,将较多低频的实体词,添加本地的自定义词典;

12、组合规则:判断字序列在字典中或者n-gram列表中;

13、内部凝固度规则:计算待识别汉字同上下文为2的窗口内每个字符的内部凝固度,作为抽取词语中准备使用的一个重要的衡量特征;

14、左邻字熵与右邻字熵规则:利用左邻字熵来衡量左邻字集合的随机性,利用右邻字熵来衡量右邻字集合的随机性;

15、缩略词挖掘模型:支持利用数据驱动,在大量的数据的基础上训练出相应的模型,进行实体对应缩略词的自动预测,用于通过字符级别、词级别以及概念级别表示,增强军事数据的特征表达能力;

16、多模态实体模型:支持利用内网搜索引擎或者文件搜索引擎构建多模态知识图谱,用于实现语义理解问题,利用模态之间的互补性,获取每种模态潜在解释因素的监督信息。

17、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(2)中的实体关系抽取模型包括无监督关系抽取模型和有监督关系抽取模型;

18、无监督关系抽取模型:支持抽取共现关系和近义关系,用于实现从文档中抽取关系,通过共现关系和近义关系,输入文档,输出军事知识实体关系;

19、有监督关系抽取模型:支持基于模板匹配的关系抽取模型、基于深度序列标注模型的抽取器以及基于预训练模型的抽取器,用于实现从模板和句子中抽取关系,通过模板匹配关系抽取规则、基于深度序列标注抽取规则以及基于预训练抽取规则,输入模板和文本句子,输出军事知识实体关系。

20、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(3)中的事件抽取模型包括事件识别模型和事件结构化模型;

21、事件识别模型:基于规则的事件三元组,识别事件候选过滤和消歧,用于实现引入知识库外部知识,通过基于规则的时间识别规则、事件候选过滤和消歧规则,事件抽取系统输出结构化实体事件知识,并提供事件可视化系统进行事件展示;

22、事件结构化模型:事件时间消歧技术,段落级别事件分类,事件触发词识别,用于实现为知识库中的实体补充丰富的动态事件知识,通过段落级别事件分类规则、事件触发词识别及分类规则处理,构建事件关系模型,对事件进行分类,识别事件的触发词。

23、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(4)中军事数据知识图谱融合接口包括实体对齐、属性对齐、属性值对齐;

24、实体对齐:支持基于图方法的实体对齐模型,基于融合特征相似度的实体对齐模型,基于卷积神经网络的实体对齐模型,基于人工标注的实体对齐模型,用于实现判断两个知识图谱中的实体是否等价,进行数据预处理、分块、成对对齐和集体对齐,统一实体命名,降低需要计算的实体对的数量,匹配实体信息;

25、属性对齐:基于学习的通用算法,数据驱动的细粒度对齐,用于实现用统一的属性名称表示,采取属性名称相似性规则、外部同义词知识库、属性取值相似度规则,将单数据源中的所有等价属性合并;

26、属性值对齐:异构信息网络,投票算法,用于实现删除重复和错误知识,通过属性值规范化规则、投票策略规则,合并来自不同知识图谱,同一实体属性的属性值。

27、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(5)中军事知识图谱推理接口包括链接预测接口、三元组分类接口;

28、链接预测接口:选择与给定关系相关的单词,以减少不相关和噪声单词的干扰,从相关文本中,模型采用完全卷积网络提取词的嵌入,最后,将提取的词嵌入与知识图谱中的现有实体进行比较,以解决目标实体的排序列表,用于实现减少不相关和噪声单词的干扰,通过依存关系的文本隐藏规则、目标融合规则、语义平均规则,采用完全卷积网络提取词的嵌入;

29、三元组分类接口:使用编码器和解码器模型,编码器依次输入向量、关系变换、向量变换、权重聚合、输出向量组成,解码器通过输出分数判断三元组的合理性,用于实现军事知识图谱补全,通过逻辑注意网络,将三元组的实体编码成向量,实体对应的关系向量化表示,融合三元组中向量表示和实体向量表示,聚合实体信息和关系信息推测目标实体,利用打分函数判断目标实体间的关系合理性。

30、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,步骤(6)中知识图谱智能更新模型包括结构化军事数据更新模型、非结构化军事数据更新模型、半结构化军事数据更新模型;

31、结构化军事数据更新模型:主要有两种技术手段,分别是插入与替换;

32、非结构化军事数据更新模型:采用开放域关系抽取的方式,主要包括关系模式抽取、候选关系抽取及关系过滤这三个模块,来进行军事知识更新;

33、半结构化军事数据更新模型:采用实体发现、实体更新、实体扩展及扩展更新的方法进行知识更新。

34、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,所述的结构化军事数据更新模型用于实现插入或替换原军事知识图谱中的知识,通过插入或替换规则,将结构化链接军事数据或结构化数据库军事数据插入或替换原军事知识图谱中的知识。

35、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,所述的非结构化军事数据更新模型用于实现开放域的关系抽取,通过关系模式抽取规则、候选关系抽取规则及关系过滤规则,从文本中抽取表示关系的指示词,从而得到实体关系元组。

36、本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的面向军事数据的知识图谱自动构建及自适应扩展方法,所述的半结构化军事数据更新模型用于实现识别出已变化的实体并集市的覆盖新出现的实体,利用实体发现规则、实体更新规则、实体扩展规则及扩展更新规则,预测实体的更新频率值,进行军事数据更新。

37、与现有技术相比,本发明的有益效果:

38、(1)本发明调用军事数据知识图谱融合接口,包括实体对齐、属性对齐、数值融合接口,消解军事数据冲突,增加军事数据领域多源异构数据的知识提取准确度;

39、(2)本发明构建实体信息抽取模型,能够构建领域词汇集模型、缩略词挖掘模型、多模态实体模型,输出结构化实体事件,提高分析挖掘效率,增强源数据综合分析能力;

40、(3)本发明建立知识图谱更新模型,能够构建结构化军事数据更新模型、非结构化军事数据更新模型、半结构化军事数据更新模型,对高概率可能发生变化的实体进行更新,减少知识图谱的更新代价。

本文地址:https://www.jishuxx.com/zhuanli/20240819/275076.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。