技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种问答处理方法、装置、存储介质及电子设备与流程  >  正文

一种问答处理方法、装置、存储介质及电子设备与流程

  • 国知局
  • 2024-08-08 16:52:29

本发明涉及自然语言处理,特别涉及一种问答处理方法、装置、存储介质及电子设备。

背景技术:

1、随着人工智能技术的飞速发展,对话机器人更多的走进人们日常生活中。通过利用对话机器人,一方面可以直接基于对话机器人提供的答案进行回复,另一方面也可以基于对话机器人提供的答案对人工客服进行提示,以辅助人工客服进行答复。

2、然而,现有的问答处理方法存在答案输出不够精准、合理的问题。

技术实现思路

1、有鉴于此,本发明提供了一种问答处理方法、装置、存储介质及电子设备,主要目的在于解决目前存在答案输出不够精准问题。

2、为解决上述问题,本申请提供一种问答处理方法,包括:

3、对预先获取的每个文档资料进行段落切分处理,获得与每个文档的各标题对应的文本片段;

4、基于各标题的标题向量以及各标题对应的文本片段,构建信息对,并基于各所述信息对构建获得索引库;

5、对获取的目标问题进行向量化处理,获得与所述目标问题对应的目标问题向量;

6、基于所述目标问题向量在所述索引库中进行搜索,获得与所述目标问题向量匹配的若干目标标题向量;

7、基于所述目标问题以及各所述目标标题向量所对应的目标文本片段,利用预先训练获得的目标问答模型,生成与所述目标问题对应的目标答案并输出。

8、可选的,所述对预先获取的每个文档资料进行段落切分处理,获得与每个文档的各标题对应的文本片段,具体包括:

9、对各所述文档资料进行格式转换处理,获得图片格式的图片资料;

10、对各图片资料进行光学字符识别,确定图片资料中各标题的标题信息、各标题的标题等级以及各标题对应的段落正文;

11、对图片资料进行文本格式转换,获得文本格式的文本资料,并基于每个图片资料中的各标题的标题信息、各标题的标题等级以及各标题对应的段落正文,对所述文本资料进行段落切分处理,获得与各标题对应的文本片段。

12、可选的,所述基于各标题的标题向量以及各标题对应的文本片段,构建信息对,并基于各所述信息对构建获得索引库,具体包括:

13、基于预先训练获得的语义向量模型对各所述标题进行向量化处理,获得与各标题对应的标题向量;

14、将各标题的标题向量作为键,将各标题对应、文本片段中的段落正文作为值,构建若干键值对,以构建各所述信息对;

15、基于各所述信息对构建获得所述索引库。

16、可选的,所述对获取的目标问题进行向量化处理,获得与所述目标问题对应的目标问题向量,具体包括:

17、基于预先训练获得的语义向量模型,对所述目标问题进行向量化处理,获得与所述目标问题对应的目标问题向量。

18、可选的,所述基于所述目标问题向量在所述索引库中进行搜索,获得与所述目标问题向量匹配的若干目标标题向量,具体包括:

19、基于所述索引库中各标题向量,分别与所述目标问题向量进行相似度计算,获得各标题向量与所述目标问题向量的相似度;

20、基于各相似度的大小顺序,确定相似度排序靠前的前预定个数的标题向量为目标标题向量。

21、可选的,基于所述索引库中各标题向量,分别与所述目标问题向量进行相似度计算,获得各标题向量与所述目标问题向量的相似度,具体包括:

22、基于各标题向量分别与所述目标问题向量进行向量内积计算,以获得各标题向量与所述目标问题向量的相似度。

23、可选的,在生成与所述目标问题对应的目标答案之前,所述方法还包括:获取历史对话信息;

24、所述基于所述目标问题以及各所述目标标题向量所对应的目标文本片段,利用预先训练获得的目标问答模型,生成与所述目标问题对应的目标答案并输出,具体包括:

25、基于所述历史对话信息、目标问题以及各所述目标文本片段,利用所述目标问答模型,生成与所述目标问题对应的目标答案并输出。

26、为解决上述问题,本申请提供一种问答处理装置,包括:

27、切分模块,用于对预先获取的每个文档资料进行段落切分处理,获得与每个文档的各标题对应的文本片段;

28、构建模块,用于基于各标题的标题向量以及各标题对应的文本片段,构建信息对,并基于各所述信息对构建获得索引库;

29、处理模块,用于对获取的目标问题进行向量化处理,获得与所述目标问题对应的目标问题向量;

30、搜索模块,用于基于所述目标问题向量在所述索引库中进行搜索,获得与所述目标问题向量匹配的若干目标标题向量;

31、生成模块,用于基于所述目标问题以及各所述目标标题向量所对应的目标文本片段,利用预先训练获得的目标问答模型,生成与所述目标问题对应的目标答案并输出。

32、为解决上述问题,本申请提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述问答处理方法的步骤。

33、为解决上述问题,本申请提供一种电子设备,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现上述任一项所述问答处理方法的步骤。

34、本申请中的问答处理方法、装置存储介质及电子设备,通过基于文档资料来获得包括标题向量以及文本片段的信息对,并基于各信息对构建索引库,能够充分利用文档资料,同时能够准确的构建获得包含标题向量的索引库,便于后续基于目标问题的问题向量快速、准确的从索引库中匹配/搜索出与目标问题匹配的目标文本片段,进而可以基于各目标文本片作为提示文本,以精准的生成目标答案。

35、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

技术特征:

1.一种问答处理方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述对预先获取的每个文档资料进行段落切分处理,获得与每个文档的各标题对应的文本片段,具体包括:

3.如权利要求1所述的方法,其特征在于,所述基于各标题的标题向量以及各标题对应的文本片段,构建信息对,并基于各所述信息对构建获得索引库,具体包括:

4.如权利要求1所述的方法,其特征在于,所述对获取的目标问题进行向量化处理,获得与所述目标问题对应的目标问题向量,具体包括:

5.如权利要求1所述的方法,其特征在于,所述基于所述目标问题向量在所述索引库中进行搜索,获得与所述目标问题向量匹配的若干目标标题向量,具体包括:

6.如权利要求5所述的方法,其特征在于,基于所述索引库中各标题向量,分别与所述目标问题向量进行相似度计算,获得各标题向量与所述目标问题向量的相似度,具体包括:

7.如权利要求1至6中任一项所述的方法,其特征在于,在生成与所述目标问题对应的目标答案之前,所述方法还包括:获取历史对话信息;

8.一种问答处理装置,其特征在于,包括:

9.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-7任一项所述问答处理方法的步骤。

10.一种电子设备,其特征在于,至少包括存储器、处理器,所述存储器上存储有计算机程序,所述处理器在执行所述存储器上的计算机程序时实现上述权利要求1-7任一项所述问答处理方法的步骤。

技术总结本申请公开了一种问答处理方法、装置、存储介质及电子设备。其中,方法包括:对预先获取的每个文档资料进行段落切分处理,获得与每个文档的各标题对应的文本片段;基于各标题的标题向量以及各标题对应的文本片段,构建信息对,并基于各所述信息对构建获得索引库;对获取的目标问题进行向量化处理,获得与所述目标问题对应的目标问题向量;基于所述目标问题向量在所述索引库中进行搜索,获得与所述目标问题向量匹配的若干目标标题向量;基于所述目标问题以及各所述目标标题向量所对应的目标文本片段,利用预先训练获得的目标问答模型,生成与所述目标问题对应的目标答案并输出。本申请能够精准的输出目标答案。技术研发人员:杨传华,李银锋,黄平,黄明星,周晓波,沈鹏,龚晨受保护的技术使用者:北京水滴科技集团有限公司技术研发日:技术公布日:2024/8/5

本文地址:https://www.jishuxx.com/zhuanli/20240808/270925.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。