技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种生成答案的方法及装置与流程 > 正文

一种生成答案的方法及装置与流程

国知局
2024-07-31 23:25:11

本说明书一个或多个实施例涉及人工智能领域，尤其涉及一种生成答案的方法及装置。

背景技术：

1、大语言模型(large language model,大语言模型)是指具有大规模参数数量的自然语言处理模型。这些模型通常基于深度学习技术，以处理和生成自然语言文本。大语言模型通常具有数十亿到数千亿的参数，这使得模型能够学习和表示庞大的语言知识，涵盖广泛的语义和语法结构。

2、然而，现阶段的大语言模型在自然语言文本的处理和生成方面仍然存在着局限性。例如，当用户输入的问题需要较为复杂的推理过程时，大语言模型往往无法直接给出准确的答案。同时，大语言模型在处理表格数据时的表现不是很理想，时常会遗漏表格中的信息。因此，需要一种方法，强化大语言模型的推理能力，并使其能够更好的处理表格数据。

技术实现思路

1、本说明书一个或多个实施例描述了一种生成答案的方法及装置，通过对文档中的表格数据进行内容转换，同时在大语言模型的问答过程中加入特殊的提示文本(prompt)以激发大语言模型的推理能力和反思能力，使得大语言模型在问答的过程中能够给出更加准确的答案。

2、第一方面，提供了一种生成答案的方法，包括：

3、获取第一文档，所述第一文档中包含第一表格；

4、将所述第一表格中各个单元格的内容结合其对应的表格固定信息，转换为对应的文本内容，并替换所述第一表格，形成第二文档；所述表格固定信息包括表头信息和/或固定列信息；

5、获取问题文本，将所述第二文档、问题文本和思维链提示文本输入到大语言模型中，得到第一答案；所述思维链提示文本用于指示所述大语言模型根据所述第二文档和问题文本进行逐步推理；

6、将所述第二文档、问题文本、第一答案、思维链提示文本和反思提示文本输入到所述大语言模型中，得到第二答案；所述反思提示文本用于指示所述大语言模型根据所述第二文档和问题文本，对所述第一答案进行反思并进行再一次的推理。

7、在一种可能的实施方式中，在获取第一文档后，所述方法还包括：

8、将所述第一文档的格式转换为基于标记语言的格式；

9、根据表格在所述标记语言中的特征，确定所述第一表格在所述第一文档中的位置。

10、在一种可能的实施方式中，所述标记语言至少包括以下之一：xml、markdown、latex和yaml。

11、在一种可能的实施方式中，根据表格在所述标记语言中的特征，确定所述第一表格在所述第一文档中的位置，包括：

12、根据表格在所述标记语言中的特征，使用正则表达式，确定所述第一表格在所述第一文档中的位置。

13、在一种可能的实施方式中，所述表格固定信息包括表头信息；将所述第一表格中各个单元格的内容结合其对应的表格固定信息，转换为对应的文本内容，包括：

14、对于所述各个单元格中的目标单元格，确定其对应的目标表头信息；

15、将所述目标表头信息与所述目标单元格中的内容进行组合，得到所述目标单元格对应的目标文本内容。

16、在一种可能的实施方式中，所述表格固定信息包括表头信息和固定列信息；将所述第一表格中各个单元格的内容结合其对应的表格固定信息，转换为对应的文本内容，包括：

17、对于所述各个单元格中的目标单元格，确定其对应的目标表头信息和目标固定列信息；

18、将所述目标表头信息、目标固定列信息与所述目标单元格中的内容进行组合，得到所述目标单元格对应的目标文本内容。

19、第二方面，提供了一种生成答案的装置，包括：

20、获取单元，配置为，获取第一文档，所述第一文档中包含第一表格；

21、文档转换单元，配置为，将所述第一表格中各个单元格的内容结合其对应的表格固定信息，转换为对应的文本内容，并替换所述第一表格，形成第二文档；所述表格固定信息包括表头信息和/或固定列信息；

22、第一答案生成单元，配置为，获取问题文本，将所述第二文档、问题文本和思维链提示文本输入到大语言模型中，得到第一答案；所述思维链提示文本用于指示所述大语言模型根据所述第二文档和问题文本进行逐步推理；

23、第二答案生成单元，配置为，将所述第二文档、问题文本、第一答案、思维链提示文本和反思提示文本输入到所述大语言模型中，得到第二答案；所述反思提示文本用于指示所述大语言模型根据所述第二文档和问题文本，对所述第一答案进行反思并进行再一次的推理。

24、在一种可能的实施方式中，所述表格固定信息包括表头信息；所述文档转换单元，还配置为：

25、对于所述各个单元格中的目标单元格，确定其对应的目标表头信息；

26、将所述目标表头信息与所述目标单元格中的内容进行组合，得到所述目标单元格对应的目标文本内容。

27、在一种可能的实施方式中，所述表格固定信息包括表头信息和固定列信息；所述文档转换单元，还配置为：

28、对于所述各个单元格中的目标单元格，确定其对应的目标表头信息和目标固定列信息；

29、将所述目标表头信息、目标固定列信息与所述目标单元格中的内容进行组合，得到所述目标单元格对应的目标文本内容。

30、第三方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行第一方面的方法。

31、第四方面，提供了一种计算设备，包括存储器和处理器，其中，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现第一方面的方法。

32、本说明书实施例提出的一种生成答案的方法及装置，通过对文档中的表格数据进行内容转换，将表格中的内容转换为对应的文本内容，使得大语言模型可以更好地理解文档中的内容。同时，在大语言模型的问答过程中加入特殊的提示文本，包括思维链提示文本和反思提示文本，对大语言模型进行两次提问，以激发大语言模型的推理能力和反思能力，使得大语言模型在问答的过程中能够给出更加准确的答案。

技术特征：

1.一种生成答案的方法，包括：

2.根据权利要求1所述的方法，在获取第一文档后，所述方法还包括：

3.根据权利要求2所述的方法，其中，所述标记语言至少包括以下之一：xml、markdown、latex和yaml。

4.根据权利要求2所述的方法，根据表格在所述标记语言中的特征，确定所述第一表格在所述第一文档中的位置，包括：

5.根据权利要求1所述的方法，所述表格固定信息包括表头信息；将所述第一表格中各个单元格的内容结合其对应的表格固定信息，转换为对应的文本内容，包括：

6.根据权利要求1所述的方法，所述表格固定信息包括表头信息和固定列信息；将所述第一表格中各个单元格的内容结合其对应的表格固定信息，转换为对应的文本内容，包括：

7.一种生成答案的装置，包括：

8.根据权利要求7所述的装置，所述表格固定信息包括表头信息；所述文档转换单元，还配置为：

9.根据权利要求7所述的装置，所述表格固定信息包括表头信息和固定列信息；所述文档转换单元，还配置为：

10.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-6中任一项所述的方法。

11.一种计算设备，包括存储器和处理器，其中，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-6中任一项所述的方法。

技术总结本说明书实施例涉及一种生成答案的方法及装置，方法包括：获取第一文档，第一文档中包含第一表格。然后，将第一表格中各个单元格的内容结合其对应的表格固定信息，转换为对应的文本内容，并替换第一表格，形成第二文档；表格固定信息包括表头信息和/或固定列信息。获取问题文本，将第二文档、问题文本和思维链提示文本输入到大语言模型中，得到第一答案；思维链提示文本用于指示大语言模型根据第二文档和问题文本进行逐步推理；最后，将第二文档、问题文本、第一答案、思维链提示文本和反思提示文本输入到大语言模型中，得到第二答案；反思提示文本用于指示大语言模型根据第二文档和问题文本，对第一答案进行反思并进行再一次的推理。技术研发人员：池哲宇受保护的技术使用者：支付宝（杭州）信息技术有限公司技术研发日：技术公布日：2024/7/29