技术新讯 > 计算推算,计数设备的制造及其应用技术 > 确定提示词的方法、装置、电子设备和计算机程序产品与流程  >  正文

确定提示词的方法、装置、电子设备和计算机程序产品与流程

  • 国知局
  • 2024-12-26 15:04:05

本申请涉及计算机,尤其具体地涉及确定提示词的方法、装置、电子设备以及计算机程序产品。

背景技术:

1、在语言模型逐渐发展的时代,将语言模型和数据平台(例如,商业智能平台)系统结合成为了非常重要的研究方向。二者的结合不仅能够充分利用语言模型在自然语言处理和理解方面的优势,还可以赋予数据平台更强大的数据分析和解读能力,从而实现对海量数据的智能挖掘与分析。

2、用户通过自然语言提出查询需求,利用语言模型将自然语言转化为sql(结构化查询语言),并通过数据平台执行查询,将数据结果直接呈现给用户。简化了传统的数据查询流程,使用户能够随时随地快速获取数据,降低了数据查询的门槛,满足了多样化的数据分析需求。

技术实现思路

1、本公开的实施例提供了一种用于确定提示词的方法、装置、电子设备以及计算机程序产品。

2、根据本公开的第一方面,提供了一种用于确定提示词的方法。该方法包括获取以自然语言形式指示查询需求的用户输入,用户输入为用于生成结构化查询语言sql查询的语言模型的提示词的一部分,sql查询用于从数据平台获取与查询需求有关的数据。该方法还包括基于用户输入的分词结果,生成标记集合。该方法还包括通过利用向量化模型处理用户输入和标记集合,生成用户输入的用户输入向量和标记集合的标记向量集合,标记向量集合包括标记集合中的每个标记的标记向量。该方法还包括基于用户输入向量和标记向量集合,从字段名向量库确定向量匹配字段名,字段名向量库基于数据平台中的字段名通过向量化模型而被构建。该方法还包括基于用户输入向量和标记向量集合,从字段值向量库确定向量匹配字段值,字段值向量库基于数据平台中的字段值通过向量化模型而被构建。该方法还包括基于用户输入,通过文本匹配从数据平台中的字段名确定文本匹配字段名。此外,该方法还包括基于用户输入、向量匹配字段名、向量匹配字段值以及文本匹配字段名,确定针对语言模型的目标提示词。

3、根据本公开的第二方面,提供了一种用于确定提示词的装置。该装置包括用户输入获取模块,被配置为获取以自然语言形式指示查询需求的用户输入,用户输入为用于生成结构化查询语言sql查询的语言模型的提示词的一部分,sql查询用于从数据平台获取与查询需求有关的数据。该装置还包括标记集合生成模块,被配置为基于用户输入的分词结果,生成标记集合。该装置还包括向量信息生成模块,被配置为通过利用向量化模型处理用户输入和标记集合,生成用户输入的用户输入向量和标记集合的标记向量集合,标记向量集合包括标记集合中的每个标记的标记向量。该装置还包括字段名向量匹配模块,被配置为基于用户输入向量和标记向量集合,从字段名向量库确定向量匹配字段名,字段名向量库基于数据平台中的字段名通过向量化模型而被构建。该装置还包括字段值向量匹配模块,被配置为基于用户输入向量和标记向量集合,从字段值向量库确定向量匹配字段值,字段值向量库基于数据平台中的字段值通过向量化模型而被构建。该装置还包括字段名文本匹配模块,被配置为基于用户输入,通过文本匹配从数据平台中的字段名确定文本匹配字段名。此外,该装置还包括提示内容确定模块,被配置为基于用户输入、向量匹配字段名、向量匹配字段值以及文本匹配字段名,确定针对语言模型的目标提示词。

4、根据本公开的第三方面,提供了一种电子设备。该电子设备包括处理器以及与处理器耦合的存储器,存储器具有存储于其中的指令,指令在被处理器执行时使电子设备执行根据第一方面所述的方法。

5、在本公开的第四方面中,提供了一种计算机程序产品。该计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,所述计算机可执行指令在被执行时使得计算机执行本公开的第一方面的方法的步骤。

6、技术实现要素:部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识要求保护的主题的关键特征或主要特征,也无意限制要求保护的主题的范围。

技术特征:

1.一种用于确定提示词的方法,包括:

2.根据权利要求1所述的方法,其中生成所述标记集合包括:

3.根据权利要求1所述的方法,其中从所述字段名向量库确定所述向量匹配字段名包括:

4. 根据权利要求3所述的方法,其中确定第二向量匹配字段名包括:

5.根据权利要求1所述的方法,其中从所述字段值向量库确定所述向量匹配字段值包括

6. 根据权利要求5所述的方法,其中确定所述第二向量匹配字段值包括:

7. 根据权利要求1所述的方法,其中确定所述文本匹配字段名包括:

8. 根据权利要求7所述的方法,还包括:

9.根据权利要求8所述的方法,其中确定针对所述语言模型的所述目标提示词包括:

10.一种用于确定提示词的装置,包括:

11. 一种电子设备,包括:

12.一种计算机程序产品,所述计算机程序产品被有形地存储在非瞬态计算机可读介质上并且包括计算机可执行指令,所述计算机可执行指令用于执行根据权利要求1至9中的任一项所述的方法。

技术总结本公开的实施例涉及确定提示词的方法、装置、电子设备和计算机程序产品。该方法包括获取用户输入,并且生成用户输入的标记集合。该方法还包括基于用户输入向量和标记向量集合,从字段名向量库确定向量匹配字段名,并且从字段值向量库确定向量匹配字段值,并且通过文本匹配确定文本匹配字段名。此外,该方法还包括基于用户输入、向量匹配字段名、向量匹配字段值以及文本匹配字段名,确定目标提示词。通过本公开的实施例,能够准确筛选与用户输入相关的字段名和字段值,减少提示词中的无关信息,从而提高了语言模型生成SQL的准确性和效率,使用户能够更快速、准确地从数据平台中获取所需数据。技术研发人员:王启航受保护的技术使用者:北京火山引擎科技有限公司技术研发日:技术公布日:2024/12/23

本文地址:https://www.jishuxx.com/zhuanli/20241226/344393.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。