数据处理的方法及装置、非易失性存储介质、电子设备与流程
- 国知局
- 2024-11-06 14:46:45
本申请涉及数据处理,具体而言,涉及一种数据处理的方法及装置、非易失性存储介质、电子设备。
背景技术:
1、目前大型语言模型(large language model,llm)在数学推理任务中已经取得了显著的进展,但是相关技术中采用大型语言模型处理数学问题时,尤其是处理大数值计算的数学问题时,输出的答案不准确。并且,相关技术中在训练用于处理大数值的数学问题的大型语言模型时,需要收集大量的数学问题数据,在对这些数学问题数据进行标记后作为训练数据,利用上述的训练数据在训练过程中对大型语言模型进行训练和调整;虽然通过训练能够提高大型语言模型处理数学问题的准确性,但是训练过程中需要大量的标注数据和计算资源,因此,存在占用大量计算资源,导致大语言模型处理数学问题时出现卡顿的情况,处理效率低的问题;因此,相关技术中采用通用的大型语言模型处理数学问题,尤其是处理大数值计算的数学问题时,存在准确率低,计算资源占用多、处理效率低的问题。
2、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请实施例提供了一种数据处理的方法及装置、非易失性存储介质、电子设备,以至少解决相关技术中采用的大型语言模型处理数学问题时,输出的答案准确率低的技术问题。
2、根据本申请实施例的一个方面,提供了一种数据处理的方法,包括:获取大型语言模型针对至少一个输入的数学问题的输出结果,其中,输出结果中至少包括解题过程;生成用于处理解题过程中包含的解题公式的思维链,其中,每个解题过程对应一个思维链;基于竖式计算的方式处理思维链中包含的目标公式,得到最终结果,其中,最终结果为针对数学问题输出的答案。
3、可选地,生成用于处理解题过程中包含的解题公式的思维链,其中,在解题公式中不存在未知数的情况下,生成第一类思维链,第一类思维链包括以下步骤:将解题公式确定为目标公式。
4、可选地,生成用于处理解题过程中包含的解题公式的思维链,其中,在解题公式中仅存在一类未知数的情况下,生成第二类思维链,第二类思维链包括以下步骤:根据解题公式建立用于求解未知数的第一目标等式;将第一目标等式中不包含未知数的一侧确定为目标公式。
5、可选地,生成用于处理解题过程中包含的解题公式的思维链,其中,在解题公式中存在多类未知数的情况下,生成第三类思维链,第三类思维链包括以下步骤:根据解题公式建立第二目标等式,其中,第二目标等式的两侧分别为不同类的未知数;根据第二目标等式和解题公式建立第三目标等式,其中,第三目标等式的一侧仅存在一类未知数,第三目标等式的另一侧不存在未知数;将第三目标等式中不存在未知数的一侧的公式确定为目标公式。
6、可选地,基于竖式计算的方式处理思维链中包含的目标公式,包括:确定目标公式对应的计算类型,其中,计算类型包括以下至少之一:加法、减法、乘法;通过竖式计算的方式对目标公式执行计算类型对应的计算流程。
7、可选地,通过竖式计算的方式对目标公式执行计算类型对应的计算流程,得到最终结果,包括:获取目标公式中的每个待处理数据的标识信息,其中,每个标识信息包括:待处理数据的每个位数对应的数据;按照位数从低到高的顺序依次对各个数据执行计算流程,得到各个位数对应的计算结果;将多个计算结果合并为最终结果。
8、可选地,将多个计算结果合并为最终结果,包括:对于每个位数,将多个计算结果中位于同一位数的数字进行累加运算,得到累加结果;在累加结果的位数为一位的情况下,将累加结果确定为当前位数的目标计算结果;在累加结果的位数大于一位的情况下,将累加结果的最低位数对应的数字确定为当前位数的目标计算结果,其中,累加结果的最高位数对应的数字用于与当前位数的上一位数对应的累加结果进行累加;直到每个位数对应的目标计算结果的位数均为一位的情况下,将多个目标计算结果按照每个目标计算结果对应的位数从低到高的顺序排列,生成数字序列,其中,数字序列为最终结果。
9、根据本申请实施例的另一方面,还提供了一种数据处理的装置,包括:获取模块,用于获取大型语言模型针对至少一个输入的数学问题的输出结果,其中,输出结果中至少包括解题过程;生成模块,用于生成用于处理解题过程中包含的解题公式的思维链,其中,每个解题过程对应一个思维链;处理模块,用于基于竖式计算的方式处理思维链中包含的目标公式,得到最终结果,其中,最终结果为针对数学问题输出的答案。
10、根据本申请实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质中存储有计算机程序,其中,在非易失性存储介质所在设备通过运行计算机程序执行上述的数据处理的方法。
11、根据本申请实施例的另一方面,还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为通过计算机程序执行上述的数据处理的方法。
12、根据本申请实施例的另一方面,还提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现上述数据处理的方法的步骤。
13、在本申请实施例中,采用获取大型语言模型针对至少一个输入的数学问题的输出结果,其中,输出结果中至少包括解题过程;生成用于处理解题过程中包含的解题公式的思维链,其中,每个解题过程对应一个思维链;基于竖式计算的方式处理思维链中包含的目标公式,得到最终结果,其中,最终结果为针对数学问题输出的答案的方式,通过在模型的训练过程中引入由思维链方法和竖式计算方法共同处理数学问题,时生成的数据作为训练数据,利用基于思维链方法和竖式计算方法训练后的大型语言模型处理数学问题,其中,训练后的大型语言模型在处理数学问题时,首先通过思维链的方法对通用大型语言模型输出的解题过程进行分解,将其分解为多个适用竖式计算的中间步骤,再通过竖式计算的方式处理各个中间步骤,达到了在处理大数值的数学问题/复杂数学问题时,将其分解为多个中间步骤,并且采用竖式计算的方法处理分解得到的多个中间步骤,实现了减少占用的计算资源、提高输出答案的准确率的技术效果,进而解决了相关技术中采用的大型语言模型处理数学问题时,输出的答案准确率低技术问题。
技术特征:1.一种数据处理的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,生成用于处理所述解题过程中包含的解题公式的思维链,其中,在所述解题公式中不存在未知数的情况下,生成第一类思维链,所述第一类思维链包括以下步骤:将所述解题公式确定为所述目标公式。
3.根据权利要求1所述的方法,其特征在于,生成用于处理所述解题过程中包含的解题公式的思维链,其中,在所述解题公式中仅存在一类未知数的情况下,生成第二类思维链,所述第二类思维链包括以下步骤:根据所述解题公式建立用于求解所述未知数的第一目标等式;将所述第一目标等式中不包含所述未知数的一侧确定为所述目标公式。
4.根据权利要求1所述的方法,其特征在于,生成用于处理所述解题过程中包含的解题公式的思维链,其中,在所述解题公式中存在多类未知数的情况下,生成第三类思维链,所述第三类思维链包括以下步骤:根据所述解题公式建立第二目标等式,其中,所述第二目标等式的两侧分别为不同类的所述未知数;根据所述第二目标等式和所述解题公式建立第三目标等式,其中,所述第三目标等式的一侧仅存在一类所述未知数,所述第三目标等式的另一侧不存在所述未知数;将所述第三目标等式中不存在所述未知数的一侧的公式确定为所述目标公式。
5.根据权利要求1所述的方法,其特征在于,基于竖式计算的方式处理所述思维链中包含的目标公式,包括:
6.根据权利要求5所述的方法,其特征在于,通过所述竖式计算的方式对所述目标公式执行所述计算类型对应的计算流程,得到最终结果,包括:
7.根据权利要求6所述的方法,其特征在于,将多个所述计算结果合并为所述最终结果,包括:
8.一种数据处理的装置,其特征在于,包括:
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质中存储有计算机程序,其中,在所述非易失性存储介质所在设备通过运行所述计算机程序执行权利要求1至7中任意一项所述的数据处理的方法。
10.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任意一项所述的数据处理的方法。
11.一种计算机程序产品,包括计算机指令,其特征在于,所述计算机指令被处理器执行时实现权利要求1至7中任意一项所述的数据处理的方法的步骤。
技术总结本申请公开了一种数据处理的方法及装置、非易失性存储介质、电子设备。其中,该方法包括:获取大型语言模型针对至少一个输入的数学问题的输出结果,其中,输出结果中至少包括解题过程;生成用于处理解题过程中包含的解题公式的思维链,其中,每个解题过程对应一个思维链;基于竖式计算的方式处理思维链中包含的目标公式,得到最终结果,其中,最终结果为针对数学问题输出的答案。本申请解决了相关技术中采用的大型语言模型处理数学问题时,输出的答案准确率低的技术问题。技术研发人员:王鑫,宋双永,王超,车仲浩,蒲璐汶,张照西受保护的技术使用者:中国电信股份有限公司技术研发日:技术公布日:2024/11/4本文地址:https://www.jishuxx.com/zhuanli/20241106/324088.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表