问答方法、电子设备及存储介质与流程
- 国知局
- 2024-09-14 15:16:31
本技术涉及计算机,尤其涉及一种问答方法、电子设备及存储介质。
背景技术:
1、对于目前的问答方法来说,通常可以对文本数据进行检索,或通过知识图谱以及直接生成文本等方式确定问题的回答;然而,这些方式仍然存在一定的局限性,例如可能受限于检索的内容和知识图谱的覆盖限制,而导致回答的准确性较低或可靠性较差的问题;由此可见,如何提升问答的准确性和可靠性是目前亟待解决的技术问题。
技术实现思路
1、本技术实施例提供了一种问答方法、电子设备及存储介质,能够有效提升问答的准确性和可靠性。
2、本技术实施例的技术方案是这样实现的:
3、第一方面,本技术实施例提供了一种问答方法,方法包括:
4、响应于问题请求,基于预设数据库中的数据对问题请求进行问题的召回处理,得到第一问题信息;其中,预设数据库用于提供召回处理的数据;预设数据库是通过获取待处理文档数据,对待处理文档数据进行数据清洗处理,得到处理后的文档数据,并基于处理后的文档数据构建的;数据清洗处理用于去除待处理文档数据中的错误数据;
5、在第一问题信息中存在第二问题信息的情况下,确定第二问题信息是否为第一数据来源中的问题信息;其中,第二问题信息表征第一问题信息中,第一相关性参数大于第一阈值的问题信息;第一相关性参数表征第一问题信息与问题请求之间的相关性的参数;第一数据来源表征预设数据库中的问答对数据;
6、在第二问题信息为第一数据来源中的问题信息的情况下,将第二问题信息对应的回答信息确定为问题请求的回答数据。
7、在本实施例中,电子设备可以在接收到问题请求的情况下,先利用预设数据库中的数据对问题请求进行问题的召回处理,得到与问题请求相关的第一问题信息,然后在第一问题信息中选择第一相关性参数大于第一阈值的第二问题信息,如果第一问题信息中存在符合条件的第二问题信息,则可以继续确定这些第二问题信息是否来自于预设数据库中的问答对数据,如果是,则可以直接将第二问题信息对应的回答信息作为回答数据输出,由此通过构建的预设数据库,配合问题的召回处理,可以极大地提升问答的准确性和可靠性;另外,可以通过获取不同领域的待处理文档数据并进行相关的数据处理,由此构建预设数据库,能够提升预设数据库所能覆盖的知识面,从而增强问答方法在不同领域的应用效果。
8、在本技术的一些实施例中,方法还包括:
9、在第一问题信息中不存在第二问题信息的情况下,基于问题请求和预设数据库中的文档数据进行相关性评估处理,以确定第三问题信息;其中,第三问题信息表征基于文档数据生成的与问题请求的相关性符合第一相关性条件的问题信息;
10、在第三问题信息中存在第四问题信息的情况下,对第四问题信息进行重排序处理,得到重排序的问题信息,并基于重排序的问题信息确定回答数据;其中,第四问题信息表征第三问题信息中与问题请求之间的相似度大于第二阈值的问题信息。
11、在本实施例中,还可以在第一问题信息中不存在第二问题信息的情况下,基于问题请求和预设数据库中的文档数据进行相关性评估处理,以基于文档数据和问题请求信息生成第三问题信息,进而判断第三问题信息中是否存在与问题请求之间的相似度大于第二阈值的第四问题信息,如果存在,则可以对第四问题信息进行重排序,并基于重排序的问题信息来确定回答数据,能够提升问答的准确性。
12、在本技术的一些实施例中,基于重排序的问题信息确定回答数据,包括:
13、确定重排序的问题信息中是否存在第五问题信息;其中,第五问题信息表征重排序的问题信息,第二相关性参数大于第三阈值的问题信息,第二相关性参数表征重排序后的问题信息与问题请求之间的相关性的参数;
14、在重排序后的问题信息中存在第五问题信息的情况下,基于第五问题信息进行文档的召回处理,以确定回答数据。
15、在本实施例中,可以确定重排序的问题信息中是否存在第二相关性参数大于第三阈值的问题信息的第五问题信息,如果存在,则可以基于第五问题信息进行文档的召回处理以获得回答数据,能够极大地提升问答的准确性。
16、在本技术的一些实施例中,方法还包括:
17、在重排序后的问题信息中不存在第五问题信息的情况下,基于第一语言模型、问题请求以及历史交互数据确定回答数据。
18、在本实施例中,可以将第一语言模型作为兜底策略,可以在重排序后的问题信息中不存在第五问题信息的情况下,基于第一语言模型和问题请求以及历史交互数据生成回答数据,提升回答的全面性和准确性。
19、在本技术的一些实施例中,方法还包括:
20、在第三问题信息中不存在第四问题信息的情况下,基于第一语言模型、问题请求以及历史交互数据确定回答数据。
21、在本实施例中,还可以在第三问题信息中不存在第四问题信息不存在第四问题信息的情况下,基于第一语言模型和问题请求以及历史交互数据生成回答数据,由此可以提升回答的全面性和准确性。
22、在本技术的一些实施例中,预设数据库包括第一数据库和第二数据库;第一问题信息包括第六问题信息和第七问题信息;基于预设数据库中的数据对问题请求进行问题的召回处理,得到第一问题信息,包括:
23、对第一数据库中存储的问答对数据和文档与查询数据中的问题数据,与问题请求进行相似度计算,得到第一相似度结果,并基于第一相似度结果从问题数据中确定第六问题信息;
24、对问题请求进行向量化处理,得到向量化的问题请求;
25、对向量化的问题数据与向量化的问题请求进行相似度计算,得到第二相似度结果,并根据第二相似度结果从向量化的问题数据中确定第七问题信息;其中,向量化的问题数据是根据第二数据库中存储的向量化的问答对数据和向量化的文档与查询数据获取的。
26、在本实施例中,预设数据库中可以包括第一数据库和第二数据库,第一数据库可以用于存储问答对数据和文档与查询数据,第二数据库可以用于存储向量化的问答对数据和向量化的文档与查询数据;在进行问题的召回处理获取第一问题信息时,电子设备可以分别基于第一数据库和问题请求进行相似度计算以确定第六问题信息,同时在对问题请求进行向量化处理以后,基于第二数据库和向量化的问题请求进行相似度计算以确定第七问题信息,由此通过同时在第一数据库和第二数据库进行问题的召回,能够有效提升问题召回的可靠性,从而提升问答的可靠性。
27、在本技术的一些实施例中,基于第一相似度结果从问题数据中确定第六问题信息,包括:
28、基于第一相似度结果从问题数据中选择第一数量的第八问题信息;
29、对第八问题信息进行向量化处理,得到向量化的第八问题信息;
30、对向量化的第八问题信息与向量化的问题请求进行相似度计算,得到第三相似度结果,将第三相似度结果中相似度信息大于第四阈值的问题信息确定为第六问题信息。
31、在本实施例中,在确定第六问题信息时,可以先根据第一相似度结果从问题数据中选择第一数量的第八问题信息,然后对第八问题信息进行向量化处理,以利用向量化的第八问题信息与向量化的问题请求进行相似度计算,从而根据得到的第三相似度结果选择出第六问题信息,由此能够令选择出的第六问题信息与问题请求之间具有较高的相似度,从而提升回答的准确性。
32、在本技术的一些实施例中,方法还包括:
33、在第二问题信息不为第一数据来源中的问题信息的情况下,基于第二问题信息进行文档的召回处理,以确定回答数据。
34、在本实施例中,如果第二问题信息不是来自于预设数据库中的问答对数据,则继续基于第二问题信息进行文档的召回处理,以确定回答数据,由此能够在问题的召回处理的基础上,结合文档的召回处理,提升问答的准确性和可靠性。
35、在本技术的一些实施例中,基于第二问题信息进行文档的召回处理,以确定回答数据,包括:
36、基于第二问题信息对应的文档单元进行上下文扩充处理,得到扩充后的文档单元;
37、基于第二语言模型对扩充后的文档单元和问题请求进行分析处理,得到回答数据。
38、在本实施例中,在基于第二问题信息进行文档的召回处理时,可以先基于第二问题信息对应的文档单元进行上下文扩充处理,以扩充后续基于第二语言模型进行分析处理的相关文档单元,从而利用第二语言模型对扩充后的文档单元和问题请求进行分析处理得到回答数据,能够有效提升回答的可靠性和准确性。
39、在本技术的一些实施例中,预设数据库包括第三数据库;基于处理后的文档数据构建预设数据库,包括:
40、基于处理后的文档数据的格式对处理后的文档数据进行文档切分处理,得到处理后的文档数据对应的文档单元;
41、将文档单元和文档单元的第一信息存储至第一数据库;其中,第一信息包括文档单元的来源信息、作者信息以及日期信息中的至少一种;
42、将处理后的文档数据存储至第三数据库,以完成预设数据库的构建。
43、在本实施例中,可以按照处理后的文档数据的格式对处理后的文档数据进行文档切分处理,得到对应的文档单元,然后将文档单元和文档单元的第一信息存储至第一数据库,同时将处理后的文档数据存储至第三数据库,以完成预设数据库的构建。
44、在本技术的一些实施例中,预设数据库还包括第四数据库;方法还包括:
45、生成处理后的文档数据对应的第一密码;
46、按照第一密码将处理后的文档数据对应的文档单元,和文档单元在处理后的文档数据中的上下文信息存储至第四数据库。
47、在本实施例中,可以将每个文档数据对应的文档单元按照统一的第一密码存储至第四数据库,从而可以提升对第四数据库中文档单元的可追溯性,提升预设数据库的后处理能力。
48、在本技术的一些实施例中,方法还包括:
49、获取问答对数据;
50、基于预设扩展模型对问答对数据进行扩展处理,得到扩展后的问答对数据;其中,扩展处理包括语义扩展处理、同义词替换处理以及意图识别处理中的至少一种;
51、将扩展后的问答对数据存储至第一数据库。
52、在本实施例中,可以获取不同领域的问答对数据,然后对问答对数据进行语义扩展处理、同义词替换处理以及意图识别处理中的至少一种,从而能够提升问答对数据在语义上的丰富度,由此构建的预设数据库能够提升后续问答的准确性。
53、在本技术的一些实施例中,方法还包括:
54、利用第一语言模型对文档单元进行查询提取处理,得到文档单元对应的查询数据;
55、根据文档单元和查询数据构成文档与查询数据,并将文档与查询数据存储至第一数据库。
56、在本实施例中,在获取文档与查询数据时,可以利用第一语言模型对切分处理后获得的文档单元进行查询提取处理,能够得到各个文档单元潜在的查询数据,并基于文档单元和对应的查询数据构成文档与查询数据进行存储,能够增强对文档单元的理解和匹配能力,提升对复杂文档进行处理时的灵活性和准确性。
57、第二方面,本技术实施例提供了一种电子设备,电子设备包括第一召回单元和确定单元;
58、第一召回单元,用于响应于问题请求,基于预设数据库中的数据对问题请求进行问题的召回处理,得到第一问题信息;预设数据库是通过获取待处理文档数据,对待处理文档数据进行数据清洗处理,得到处理后的文档数据,并基于处理后的文档数据构建的;数据清洗处理用于去除待处理文档数据中的错误数据;
59、确定单元,用于在第一问题信息中存在第二问题信息的情况下,确定第二问题信息是否为第一数据来源中的问题信息;其中,第二问题信息表征第一问题信息中,第一相关性参数大于第一阈值的问题信息;第一相关性参数表征第一问题信息与问题请求之间的相关性的参数;第一数据来源表征预设数据库中的问答对数据;以及在第二问题信息为第一数据来源中的问题信息的情况下,将第二问题信息对应的回答信息确定为问题请求的回答数据。
60、在本实施例中,电子设备可以在接收到问题请求的情况下,先利用预设数据库中的数据对问题请求进行问题的召回处理,得到与问题请求相关的第一问题信息,然后在第一问题信息中选择第一相关性参数大于第一阈值的第二问题信息,如果第一问题信息中存在符合条件的第二问题信息,则可以继续确定这些第二问题信息是否来自于预设数据库中的问答对数据,如果是,则可以直接将第二问题信息对应的回答信息作为回答数据输出,由此通过构建的预设数据库,配合问题的召回处理可以极大地提升问答的准确性和可靠性。
61、第三方面,本技术实施例提供了一种电子设备,包括处理器、存储有处理器可执行指令的存储器;当指令被处理器执行时,实现上述问答方法。
62、第四方面,本技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,实现上述问答方法。
本文地址:https://www.jishuxx.com/zhuanli/20240914/297611.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。