技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种问答方法、装置、设备及计算机可读存储介质与流程  >  正文

一种问答方法、装置、设备及计算机可读存储介质与流程

  • 国知局
  • 2024-07-31 22:51:21

本发明涉及自然语言处理,特别是涉及一种问答方法、装置、设备及计算机可读存储介质。

背景技术:

1、随着人工智能和自然语言处理技术的不断进步,知识检索与问答系统已经得到了广泛的应用。目前知识检索与问答系统主要基于关键词搜索或大型语言模型实现智能问答。

2、传统的基于关键词搜索的检索系统虽然能够快速返回匹配查询关键词的文档,但往往无法很好地理解查询的语义,导致检索结果相关性不高。大型语言模型虽然具备一定的问答能力,但由于其知识仅来源于训练语料,容易产生幻觉和事实错误。

3、综上所述,如何有效地解决问答的检索结果相关性不高,容易产生幻觉和事实错误等问题,是目前本领域技术人员急需解决的问题。

技术实现思路

1、本发明的目的是提供一种问答方法,该方法适用于各种应用场景,实现了对最终的目标推理结果和引用的知识库检索结果的同时展示,确保用户能够直观地看到模型推理的依据,降低幻觉风险;本发明的另一目的是提供一种问答装置、设备及计算机可读存储介质。

2、为解决上述技术问题,本发明提供如下技术方案:

3、一种问答方法,包括:

4、接收待回答的目标问题;

5、利用文本转向量模型对所述目标问题进行向量化处理,得到问题向量;

6、利用向量库对所述问题向量进行相似文本检索,得到知识库检索结果;

7、根据所述知识库检索结果构造目标提示词;

8、利用推理模型对所述目标提示词进行推理,得到目标推理结果;

9、将所述知识库检索结果和所述目标推理结果返回给所述目标问题的问题发送端。

10、在本发明的一种具体实施方式中,利用文本转向量模型对所述目标问题进行向量化处理,包括:

11、利用文本转向量模型根据预设向量模型参数对所述目标问题进行向量化处理;其中,所述预设向量模型参数包括文本切割大小、预设重合度和向量化时是否进行归一化处理。

12、在本发明的一种具体实施方式中,在接收待回答的目标问题之后,利用文本转向量模型对所述目标问题进行向量化处理之前,还包括:

13、获取所述目标问题的目标数据格式;

14、根据所述目标数据格式对所述目标问题进行文本提取,得到预设统一格式的目标文本数据;

15、相应的,利用文本转向量模型对所述目标问题进行向量化处理,包括:

16、利用文本转向量模型对所述目标文本数据进行向量化处理。

17、在本发明的一种具体实施方式中,利用文本转向量模型对所述目标文本数据进行向量化处理,包括:

18、对所述目标文本数据进行文本清洗,得到清洗后文本数据;

19、对所述清洗后文本数据进行分片处理,得到文本片段集合;

20、利用文本转向量模型对所述文本片段集合进行向量化处理。

21、在本发明的一种具体实施方式中,对所述清洗后文本数据进行分片处理,包括:

22、对所述清洗后文本数据按照预设切分粒度进行分片处理;其中,所述预设切分粒度包括文档粒度、段落粒度、句子粒度。

23、在本发明的一种具体实施方式中,对所述清洗后文本数据按照预设切分粒度进行分片处理,包括:

24、通过滑动窗口方式根据预设窗口大小和预设滑动步长对所述清洗后文本数据按照所述预设切分粒度进行分片处理。

25、在本发明的一种具体实施方式中,根据所述目标数据格式对所述目标问题进行文本提取,包括:

26、当根据所述目标数据格式确定所述目标问题为非纯文本数据时,通过结构化方式对所述目标问题进行文本提取。

27、在本发明的一种具体实施方式中,根据所述知识库检索结果构造目标提示词,包括:

28、根据所述知识库检索结果对预设提示模板进行渲染,得到所述目标提示词。

29、在本发明的一种具体实施方式中,利用向量库对所述问题向量进行相似文本检索,包括:

30、利用所述向量库根据预选检索算法和预设检索参数对所述问题向量进行相似文本检索。

31、在本发明的一种具体实施方式中,利用所述向量库根据预选检索算法和预设检索参数对所述问题向量进行相似文本检索,得到知识库检索结果,包括:

32、利用所述向量库根据预设相似度算法对所述问题向量进行相似文本检索,得到各第一初始相似问题向量;

33、获取根据所述预设相似度算法设定的相似度判定阈值;

34、从各第一初始相似问题向量中选取与所述问题向量之间的相似度参考量符合所述相似度判定阈值的第一初始相似问题向量,并将与所述问题向量之间的相似度参考量符合所述相似度判定阈值的第一初始相似问题向量确定为第一目标相似问题向量;

35、从所述向量库中获取所述第一目标相似问题向量对应的第一答案;

36、将所述第一目标相似问题向量和所述第一答案构成的问答对确定为所述知识库检索结果。

37、在本发明的一种具体实施方式中,利用文本转向量模型对所述目标问题进行向量化处理,包括:

38、利用预加载完成的文本转向量模型对所述目标问题进行向量化处理。

39、在本发明的一种具体实施方式中,利用预加载完成的文本转向量模型对所述目标问题进行向量化处理,包括:

40、利用通过单例加载模式预加载完成的文本转向量模型对所述目标问题进行向量化处理。

41、一种问答设备,包括:

42、存储器,用于存储计算机程序;

43、处理器,用于执行所述计算机程序时实现如前所述问答方法的步骤。

44、一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述问答方法的步骤。

45、一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如前所述问答方法的步骤。

46、本发明所提供的问答方法,接收待回答的目标问题;利用文本转向量模型对目标问题进行向量化处理,得到问题向量;利用向量库对问题向量进行相似文本检索,得到知识库检索结果;根据知识库检索结果构造目标提示词;利用推理模型对目标提示词进行推理,得到目标推理结果;将知识库检索结果和目标推理结果返回给目标问题的问题发送端。

47、本发明的有益效果在于,通过设置支持用户根据需求选择文本转向量模型,通过文本转向量模型对目标问题进行向量化处理,得到问题向量,适用于各种应用场景。预先创建向量库,并在向量库中设置检索模块,在对目标问题进行向量化处理得到问题向量之后,利用向量库对问题向量进行相似文本检索,并根据知识库检索结果构造目标提示词。利用推理模型对目标提示词进行推理,得到目标推理结果,将知识库检索结果和目标推理结果返回给目标问题的问题发送端,从而实现了对最终的目标推理结果和引用的知识库检索结果的同时展示,确保用户能够直观地看到模型推理的依据,降低幻觉风险。

48、相应的,本发明还提供了与上述问答方法相对应的问答装置、设备和计算机可读存储介质,具有上述技术效果,在此不再赘述。

本文地址:https://www.jishuxx.com/zhuanli/20240730/195013.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。