表格查询方法、装置、设备、存储介质及计算机程序产品与流程
- 国知局
- 2024-10-21 14:30:42
本申请涉及计算机,尤其涉及一种表格查询方法、装置、设备、存储介质及计算机程序产品。背景技术:::1、表格问答(tableqa)查询是基于nlp(natural language processing,自然语音处理)技术,通过预先存储在数据库中的表格结构和表格数据,基于text2sql(text-to-sql,文本转sql查询)模型将自然语言形式的问题转换为对应的sql查询语句,通过sql查询语句进行查询,得到查询结果。2、但text2sql模型对于文本转sql的预测准确性较低,且输入的文本需要与表格中的查询指标完全一致,不支持模糊查询语句的生成,导致最终生成的sql查询语句所得到的查询结果为空,表格查询失败。技术实现思路1、本申请提供表格查询方法、装置、设备、存储介质及计算机程序产品用以解决表格查询准确率低的问题。2、第一方面,本申请提供一种表格查询方法,包括:3、对输入的文本进行场景识别,获取表征表格检索场景类别的第一目标问题文本;4、基于所述第一目标问题文本和表格数据,生成第一查询语句,以基于所述第一查询语句对所述表格数据进行查询,得到第一查询结果;5、计算所述第一目标问题文本与所述表格数据中各表格内容的之间的文本相似度,以基于所述文本相似度确定第二查询结果;6、将所述第一查询结果和所述第二查询结果作为所述第一目标问题的表格查询结果。7、在一种可实现方式中,所述计算所述第一目标问题文本与所述表格数据中各表格内容的之间的文本相似度,包括:8、将所述表格数据中的至少一个表格内容分别转换为自然语言,得到至少一个表格文本;其中,所述表格内容表征所述表格数据中行所对应的数据;9、计算所述至少一个表格文本中各表格文本与所述第一目标问题文本之间的相似度,得到各表格文本所对应的文本相似度。10、在一种可实现方式中,所述计算所述至少一个表格文本中各表格文本与所述第一目标问题文本之间的相似度,得到各表格文本所对应的文本相似度,包括:11、将所述至少一个表格文本分别转换为对应的向量表示;12、基于各表格文本对应的向量表示与所述第一目标问题文本,计算所述各表格文本所对应的文本相似度。13、在一种可实现方式中,所述第一查询结果包括至少一个表格内容,所述第二查询结果包括至少一个表格内容,所述表格内容表征所述表格数据中行所对应的数据;所述将所述第一查询结果和所述第二查询结果作为所述第一目标问题的表格查询结果,包括:14、为所述第一查询结果中的各表格内容分别分配第一权重,并为所述第二查询结果中的各表格内容分别分配第二权重;15、基于所述第一查询结果中的各表格内容对应的第一权重以及所述第二查询结果中的各表格内容对应的第二权重,对所述第一查询结果中的各表格内容和所述第二查询结果中的各表格内容进行排序,得到表格内容序列,以将所述表格内容序列作为所述第一目标问题的表格查询结果。16、在一种可实现方式中,所述方法还包括:17、对输入的文本进行场景识别,获取第二目标问题文本;其中,所述第二目标问题文本表征表格问答场景类别的文本;18、基于所述第二目标问题文本和表格数据,生成第二查询语句,以基于所述第二查询语句对所述表格数据进行查询,得到第三查询结果;19、将所述第三查询结果和所述第二目标问题文本作为示例输入至大语言模型,得到所述第二目标问题文本的查询结果文本;其中,所述示例用于指示所述大语言模型根据所述第二目标问题文本将所述查询结果文本转化为所述查询结果文本,所述查询结果文本为自然语言表征所述第三查询结果对应的自然语言。20、在一种可实现方式中,所述对输入的文本进行场景识别,包括:21、将输入的文本输入至场景分类模型,得到所述输入的文本对应的场景类别;其中,所述场景分类模型为基于带有场景类别标签的训练文本进行训练得到。22、在一种可实现方式中,所述基于所述文本相似度确定第二查询结果,包括:23、将所述文本相似度的数值大于预设数值的表格内容作为第二查询结果。24、第二方面,本申请提供一种表格查询装置,包括:场景识别模块,用于对输入的文本进行场景识别,获取表征表格检索场景类别的第一目标问题文本;25、第一查询结果获取模块,用于基于所述第一目标问题文本和表格数据,生成第一查询语句,以基于所述第一查询语句对所述表格数据进行查询,得到第一查询结果;26、第二查询结果获取模块,用于计算所述第一目标问题文本与所述表格数据中各表格内容的之间的文本相似度,以基于所述文本相似度确定第二查询结果;27、表格查询结果获取模块,用于将所述第一查询结果和所述第二查询结果作为所述第一目标问题的表格查询结果。28、第三方面,本申请提供一种电子设备,电子设备包括:处理器、存储器;所述存储器用于存储指令;所述处理器用于执行所述存储器中的指令,使得所述电子设备执行如第一方面所述的方法。29、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。30、第五方面,本申请提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。31、本申请提供的表格查询方法、装置、设备、存储介质及计算机程序产品,针对表格检索场景类别的问题文本,一方面生成查询语句以通过查询语句对表格进行查询获取查询结果;另一方面还通过相似度计算,获取表格中与问题文本相似度高的第二查询结果,从而通过两路进行问题文本表格查询,且相似度计算可以进行模糊问题文本的查询,避免查询语句不支持模糊查询导致查询结果为空的情况发生,查询结果准确度高。技术特征:1.一种表格查询方法,其特征在于,包括:2.根据权利要求1所述的方法,其特征在于,所述计算所述第一目标问题文本与所述表格数据中各表格内容的之间的文本相似度,包括:3.根据权利要求2所述的方法,其特征在于,所述计算所述至少一个表格文本中各表格文本与所述第一目标问题文本之间的相似度,得到各表格文本所对应的文本相似度,包括:4.根据权利要求1所述的方法,其特征在于,所述第一查询结果包括至少一个表格内容,所述第二查询结果包括至少一个表格内容,所述表格内容表征所述表格数据中行所对应的数据;所述将所述第一查询结果和所述第二查询结果作为所述第一目标问题的表格查询结果,包括:5.根据权利要求1-4中任一项所述的方法,其特征在于,所述方法还包括:6.根据权利要求1所述的方法,其特征在于,所述对输入的文本进行场景识别,包括:7.根据权利要求1所述的方法,其特征在于,所述基于所述文本相似度确定第二查询结果,包括:8.一种表格查询装置,其特征在于,包括:9.一种电子设备,其特征在于,所述电子设备包括:处理器、存储器;所述存储器用于存储指令;所述处理器用于执行所述存储器中的指令,使得所述电子设备执行如权利要求1至7中任一项所述方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7中任一项所述的方法。11.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。技术总结本申请提供一种表格查询方法、装置、设备、存储介质及计算机程序产品。该方法包括:对输入的文本进行场景识别,获取表征表格检索场景类别的第一目标问题文本;基于第一目标问题文本和表格数据,生成第一查询语句,以基于第一查询语句对表格数据进行查询,得到第一查询结果;计算第一目标问题文本与表格数据中各表格内容的之间的文本相似度,以基于文本相似度确定第二查询结果;将第一查询结果和第二查询结果作为第一目标问题的表格查询结果。本申请的方法可提高表格查询的准确率。技术研发人员:戴桢锦,张雨,刘梅琛受保护的技术使用者:人保信息科技有限公司技术研发日:技术公布日:2024/10/17
本文地址:https://www.jishuxx.com/zhuanli/20241021/318410.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表