技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于锡冶炼知识图谱的问答方法及系统  >  正文

一种基于锡冶炼知识图谱的问答方法及系统

  • 国知局
  • 2024-10-21 14:35:45

本发明涉及智能问答,具体涉及一种基于锡冶炼知识图谱的问答方法及系统。

背景技术:

1、锡冶炼领域知识涉及大量专业术语、技术细节和特定操作流程。目前,锡冶炼知识可以通过谷歌等搜索引擎或一些冶金数据库获得。但通常情况下,来自搜索引擎的答案不够专业,需要人工过滤,效率低下。而专业的冶金数据库根据输入矿物的关键词后返回答案,但通常关键词不能反映问题的整体意图,无法给出准确答案,并且无法回答自然语言输入的问题。因此,需要一种能够准确、高效地回答冶金问题,并允许问题以自然语言输入的新方法。

2、基于知识图谱的问答方法虽然提供了可行的方案,但也存在一些限制。知识图谱虽然能够提供高质量的关联知识,但其问答范围和形式受到限制,无法适应自然语言问句的灵活性和模糊性。并且,知识图谱需要不断更新,并依赖于预定义的实体和关系类型。知识图谱中的大多数关系往往只反映实体之间的静态交互,而不能表示相关实体的动态活动和状态变化。此外,传统的知识图谱通常依赖于实体和关系的匹配特征对单个问答对进行独立推理,缺乏深度理解和推理能力来解决需要推理的复杂问题。当处理复杂问题和推理查询时,这种限制提出了显著的约束。

技术实现思路

1、本发明的技术方案是:根据锡冶炼知识数据构建知识图谱数据库和知识向量数据库;然后将锡冶炼场景中的自然语言问题翻译成知识图谱格式的查询语句,并在知识图谱数据库中查询以生成自然语言答案;如果知识图谱中未找到匹配的三元组,则使用检索增强生成技术在知识向量数据库中检索以生成答案。

2、第一方面,本申请提供了一种基于锡冶炼知识图谱的问答方法,具体步骤为:

3、step1:基于锡冶炼知识数据,构建锡冶炼知识图谱数据库;

4、step1.1:对收集的锡冶炼数据进行预处理,得到文本数据;

5、step1.2:对于结构化数据直接存储为三元组格式,对于非结构化数据通过实体识别和关系提取,转化为结构化的三元组形式,构建知识图谱数据库;

6、step1.3:基于现有的三元组数据和推理规则进行知识推理,生成新的三元组;对通过知识推理生成的新三元组的进行质量评估,并将通过质量评估的新三元组存储在知识图谱数据库中。

7、step2:基于锡冶炼知识数据,构建锡冶炼知识向量数据库;

8、step2.1:将step 1.1中预处理好的文本数据分割成段落;

9、step2.2:使用roberta模型对分割后的文本数据进行向量化处理,将文本转化为高维数值向量;

10、step2.3:将向量化后的数据存储在知识向量数据库中,并创建基于欧几里得距离的索引。

11、step3:获取属于锡冶炼领域的问句,并将自然语言问句翻译成知识图谱格式的查询语句;

12、step3.1:通过bert-bilstm-crf模型,提取问题中的关键实体;

13、step3.2:通过bert-wwm模型,识别问题意图,并根据问题意图将问题分类到预定义的模板;

14、step3.3:根据识别出的实体和分类类型,使用预定义的问答模板构建知识图谱查询语句。

15、step4:利用查询语句在知识图谱数据库中查询,获取查询结果并生成自然语言答案;

16、step4.1:根据查询语句在知识图谱中查询相应的实体和关系。

17、step4.2:根据查询结果生成自然语言答案。

18、step5:如果知识图谱中未找到匹配的结果,则使用检索增强生成技术在知识向量数据库中检索,以生成答案;

19、step5.1:将用户问题通过roberta模型进行向量化处理,生成高维数值向量表示;

20、step5.2:使用向量数据库检索与用户问题最相似的文本段落;向量数据库通过计算用户问题向量与存储文本向量之间的欧几里得距离来进行检索,并按相似度排序,选择相似度最高的文本段落;

21、step5.3:将检索到的文本段落与用户问题一起输入到大语言模型中,并生成答案。

22、第二方面,本申请提供了一种基于锡冶炼知识图谱的问答系统,包括问句获取模块、问题分析模块、知识图谱模块、知识向量模块、图谱查询模块、检索增强模块、答案生成模块,其中:

23、所述问句获取模块负责接收用户输入问题;

24、所述问题分析模块用于解析问句获取模块接收的问句,从而确定用户的具体需求,包括实体识别子模块和意图识别子模块;

25、所述知识图谱模块根据锡冶炼知识,构建知识图谱数据库,为查询提供数据支持;

26、所述知识向量模块基于锡冶炼知识构建知识向量数据库,助于复杂的语义查询;

27、所述图谱查询模块根据问题分析模块提供的实体和意图,构建知识图谱查询语句,执行对知识图谱的具体查询;

28、所述检索增强模块通过将用户问题转换为向量,然后在知识向量数据库中搜索相似度最高的文本向量,找出与用户问题最相关的文本段落;

29、所述答案生成模块根据从数据库中查询到的信息转化为自然语言文本,呈现给用户。

30、有益效果:

31、本发明根据锡冶炼领域的知识数据,构建一个锡冶炼知识图谱数据库,同时建立一个知识向量数据库,以便多维度存储和管理知识信息。然后,从锡冶炼领域中获取相关的问句,并将这些自然语言问句翻译成适用于知识图谱的查询语句格式。在查询过程中,系统会在知识图谱数据库中进行检索,并生成相应的自然语言答案。如果在知识图谱中未找到匹配的三元组信息,则会利用检索增强生成技术,在知识向量数据库中进行深度检索,从而生成准确的答案。本发明能拥有更广泛的知识库,解决多义性、模糊语言和句子歧义问题,高效准确地生成自然语言查询的答案。

技术特征:

1.一种基于锡冶炼知识图谱的问答方法,其特征在于:

2.根据权利要求1所述的基于锡冶炼知识图谱的问答方法,其特征在于,所述step1具体为:

3.根据权利要求1所述的基于锡冶炼知识图谱的问答方法,其特征在于,所述step2具体为:

4.根据权利要求1所述的基于锡冶炼知识图谱的问答方法,其特征在于,所述step3具体为:

5.根据权利要求1所述的基于锡冶炼知识图谱的问答方法,其特征在于,所述step4具体为:

6.根据权利要求1所述的基于锡冶炼知识图谱的问答方法,其特征在于,所述step5具体为:

7.根据权利要求2所述的基于锡冶炼知识图谱的问答方法,其特征在于,step1.2中通过bert-bilstm-crf模型进行实体识别提取,通过bert-bilstm-注意力机制模型进行关系提取。

8.一种基于锡冶炼知识图谱的问答系统,其特征在于,所述系统包括问句获取模块、问题分析模块、知识图谱模块、知识向量模块、图谱查询模块、检索增强模块、答案生成模块,其中:

技术总结本发明涉及智能问答技术领域,具体提出一种基于锡冶炼知识图谱的问答方法及系统。该方法根据锡冶炼领域的知识数据,构建一个锡冶炼知识图谱数据库,同时建立一个知识向量数据库,以便多维度存储和管理知识信息。然后,从锡冶炼领域中获取相关的问句,并将这些自然语言问句翻译成适用于知识图谱的查询语句格式。在查询过程中,系统会在知识图谱数据库中进行检索,并生成相应的自然语言答案。如果在知识图谱中未找到匹配的三元组信息,则会利用检索增强生成技术,在知识向量数据库中进行深度检索,从而生成准确的答案。本发明能拥有更广泛的知识库,解决多义性、模糊语言和句子歧义问题,高效准确地生成自然语言查询的答案。技术研发人员:杨玲,陈芸,刘英莉,袁海滨,唐都作受保护的技术使用者:昆明理工大学技术研发日:技术公布日:2024/10/17

本文地址:https://www.jishuxx.com/zhuanli/20241021/318683.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。