问答处理方法、装置、电子设备和存储介质与流程
- 国知局
- 2024-08-19 14:18:45
本申请涉及数据处理,尤其涉及一种问答处理方法、装置、电子设备和存储介质。
背景技术:
1、在人工智能与大数据技术不断进步的背景下,数据库已成为构建工程与建筑管理系统不可或缺的一部分,其中企业级复杂商业系统和个人应用均涉及数据库的深入应用。
2、在问答场景下,数据库存储的数据量大,如果直接从数据库中搜索信息,检索速度在处理大规模数据时可能受到限制,需要花费较长的搜索时间,导致搜索效率低,从而降低问答效率。
技术实现思路
1、本申请提供一种问答处理方法、装置、电子设备和存储介质,用以解决现有技术中问答效率低的问题。
2、本申请提供一种问答处理方法,包括:
3、根据用户的历史交互信息和所述用户提出的问题,确定所述问题的查询向量;
4、根据所述查询向量和预设的搜索参数,在向量数据库中进行信息搜索;所述搜索参数包括搜索权重或搜索结果数量;
5、根据搜索结果生成应答信息;所述应答信息包括文本数据和/或图表数据。
6、根据本申请提供的一种问答处理方法,所述根据用户的历史交互信息和所述用户提出的问题,确定所述问题的查询向量,包括:
7、从所述历史交互信息中提取关键信息;所述关键信息表征对所述用户提出的问题有影响的信息;
8、根据所述关键信息,对所述问题进行重新表述得到新问题;
9、对所述新问题进行文本向量化,得到所述新问题的查询向量。
10、根据本申请提供的一种问答处理方法,所述搜索权重包括稀疏搜索权重和稠密搜索权重;
11、所述根据所述查询向量和预设的搜索参数,在向量数据库中进行信息搜索,包括:
12、根据所述查询向量,在所述向量数据库中进行稀疏搜索,得到稀疏搜索结果;
13、根据所述查询向量,在所述向量数据库中进行稠密搜索,得到稠密搜索结果;
14、根据所述稀疏搜索权重、所述稠密搜索权重、所述稀疏搜索结果和所述稠密搜索结果,确定所述向量数据库中各文本向量的搜索得分;
15、根据所述搜索得分,确定所述搜索结果。
16、根据本申请提供的一种问答处理方法,所述根据所述查询向量,在所述向量数据库中进行稀疏搜索,得到稀疏搜索结果,包括:
17、从所述查询向量中提取至少一个预设的关键词;
18、将所述关键词与所述向量数据库中的各文本向量进行匹配,以确定所述关键词在每个所述文本向量的出现频率;
19、根据所述出现频率,确定每个所述文本向量的权重;
20、根据每个所述文本向量的权重的排序结果,确定所述稀疏搜索结果。
21、根据本申请提供的一种问答处理方法,所述根据所述查询向量,在所述向量数据库中进行稠密搜索,得到稠密搜索结果,包括:
22、计算所述查询向量与所述向量数据库中各文本向量的语义相似度;
23、根据每个所述文本向量的语义相似度的排序结果,确定所述稠密搜索结果。
24、根据本申请提供的一种问答处理方法,所述根据所述查询向量和预设的搜索参数,在向量数据库中进行信息搜索,包括:
25、根据所述向量数据库中存储的索引结构,对所述查询向量进行近似最近邻搜索,得到与所述查询向量最相似的文本向量集合;
26、根据所述搜索结果数量,对所述文本向量集合进行筛选,得到所述搜索结果。
27、根据本申请提供的一种问答处理方法,所述向量数据库是基于以下方式构建的:
28、获取知识文档;
29、从所述知识文档中,确定数据量大于设定值的目标知识文档,对所述目标知识文档进行文档切片,得到多个文本块;
30、将所述知识文档和多个所述文本块进行向量化处理,得到向量数据;
31、根据所述向量数据,构建所述向量数据库。
32、本申请提供一种问答处理装置,包括:
33、确定模块,用于根据用户的历史交互信息和所述用户提出的问题,确定所述问题的查询向量;
34、搜索模块,用于根据所述查询向量和预设的搜索参数,在向量数据库中进行信息搜索;所述搜索参数包括搜索权重或搜索结果数量;
35、应答模块,用于根据搜索结果生成应答信息;所述应答信息包括文本数据和/或图表数据。
36、本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述问答处理方法。
37、本申请还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述问答处理方法。
38、本申请提供的问答处理方法、装置、电子设备和存储介质,通过根据用户的历史交互信息和用户提出的问题,确定问题的查询向量;根据查询向量和预设的搜索参数,在向量数据库中进行信息搜索;搜索参数包括搜索权重或搜索结果数量;根据搜索结果生成应答信息;应答信息包括文本数据和/或图表数据。本申请通过结合历史交互信息,可以更准确地理解用户的意图,使对话更加连贯,同时通过搜索参数进行搜索优化,可以提高搜索效率并减少搜索时间,使搜索结果更加精确,从而提高问答效率和准确性。
技术特征:1.一种问答处理方法,其特征在于,包括:
2.根据权利要求1所述的问答处理方法,其特征在于,所述根据用户的历史交互信息和所述用户提出的问题,确定所述问题的查询向量,包括:
3.根据权利要求1所述的问答处理方法,其特征在于,所述搜索权重包括稀疏搜索权重和稠密搜索权重;
4.根据权利要求3所述的问答处理方法,其特征在于,所述根据所述查询向量,在所述向量数据库中进行稀疏搜索,得到稀疏搜索结果,包括:
5.根据权利要求3所述的问答处理方法,其特征在于,所述根据所述查询向量,在所述向量数据库中进行稠密搜索,得到稠密搜索结果,包括:
6.根据权利要求1所述的问答处理方法,其特征在于,所述根据所述查询向量和预设的搜索参数,在向量数据库中进行信息搜索,包括:
7.根据权利要求1所述的问答处理方法,其特征在于,所述向量数据库是基于以下方式构建的:
8.一种问答处理装置,其特征在于,包括:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7中任一项所述问答处理方法。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述问答处理方法。
技术总结本申请涉及数据处理技术领域,提供一种问答处理方法、装置、电子设备和存储介质,该方法包括:根据用户的历史交互信息和用户提出的问题,确定问题的查询向量;根据查询向量和预设的搜索参数,在向量数据库中进行信息搜索;搜索参数包括搜索权重或搜索结果数量;根据搜索结果生成应答信息;应答信息包括文本数据和/或图表数据。本申请通过结合历史交互信息,可以更准确地理解用户的意图,使对话更加连贯,同时通过搜索参数进行搜索优化,可以提高搜索效率并减少搜索时间,使搜索结果更加精确,从而提高问答效率和准确性。技术研发人员:潘文硕,袁明明,黄践焜,倪健,周正受保护的技术使用者:浪潮通信信息系统有限公司技术研发日:技术公布日:2024/8/16本文地址:https://www.jishuxx.com/zhuanli/20240819/274707.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表