一种文本生成模型训练方法及装置与流程
- 国知局
- 2024-11-06 14:28:34
本公开涉及数据处理,特别涉及自然语言处理,尤其涉及一种文本生成模型训练方法及装置。
背景技术:
1、文本数据的爆炸式增长,造成了用户的数据处理负担。数据平台为了减轻用户的数据处理负担,期望能够从数据中提炼出简洁而不丢失原意的内容,使得用户仅需查阅所提炼内容即可获取数据所表达的信息。
2、现有技术中,从数据中提炼出简洁而不丢失原意的内容基于大语言模型(largelanguage model,llm)技术实现,具体为:通过预训练、优化提示指令prompt等方式,训练出用于从数据中提炼内容的大语言模型,称为文本生成模型,从而利用该文本生成模型对数据进行处理,得到模型输出的文本。
技术实现思路
1、本公开提供了一种文本生成模型训练方法及装置。
2、第一方面,本公开实施例提供了一种文本生成模型训练方法,包括:
3、获取第一样本文本;
4、将所述第一样本文本输入已训练的第一文本生成模型,得到所述第一文本生成模型输出的初始总结文本,其中,所述第一文本生成模型属于大语言模型;
5、对所述初始总结文本进行质量提升处理,得到目标总结文本;
6、将所述第一样本文本以及所述目标总结文本作为训练数据,对第二文本生成模型进行模型训练,得到训练后的第二文本生成模型。
7、第二方面,本公开实施例提供了一种文本生成模型训练装置,包括:
8、文本获取模块,用于获取第一样本文本;
9、第一模型推理模块,用于将所述第一样本文本输入已训练的第一文本生成模型,得到所述第一文本生成模型输出的初始总结文本,其中,所述第一文本生成模型属于大语言模型;
10、质量提升模块,用于对所述初始总结文本进行质量提升处理,得到目标总结文本;
11、模型训练模块,用于将所述第一样本文本以及所述目标总结文本作为训练数据,对第二文本生成模型进行模型训练,得到训练后的第二文本生成模型。
12、第三方面,本公开实施例提供了一种电子设备,包括:
13、至少一个处理器;以及
14、与所述至少一个处理器通信连接的存储器;其中,
15、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
16、第四方面,本公开实施例一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
17、第五方面,本公开实施例一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面所述的方法。
18、由以上可见,应用本公开实施例提供的方案训练文本生成模型时,在利用第一文本生成模型得到初始总结文本后,对初始总结文本进行了质量提升处理,这样能够得到第一样本文本对应的高质量的总结文本,从而将第一样本文本和目标总结文本作为训练数据来训练第二文本生成模型,能够增强第二文本生成模型的推理能力,特别是当第一样本文本为质量较低的文本时,通过质量提升处理也能够得到高质量的总结文本,从而利用质量较低的样本文本和高质量的总结文本训练第二文本生成模型,能够增强第二文本生成模型对于质量较低的文本的推理能力。
19、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
技术特征:1.一种文本生成模型训练方法,包括:
2.根据权利要求1所述的方法,其中,所述对所述初始总结文本进行质量提升处理,得到目标总结文本,包括:
3.根据权利要求1所述的方法,其中,在所述将所述第一样本文本输入已训练的第一文本生成模型之前,还包括:
4.根据权利要求3所述的方法,其中,所述对所述初始总结文本进行质量提升处理,得到目标总结文本,包括:
5.根据权利要求1所述的方法,其中,所述将所述第一样本文本输入已训练的第一文本生成模型,得到所述第一文本生成模型输出的初始总结文本,包括:
6.根据权利要求5所述的方法,其中,
7.根据权利要求1-6中任一项所述的方法,还包括:
8.根据权利要求7所述的方法,所述根据所述预测总结文本,对所述第二文本生成模型进行推理效果评估,得到评估结果,包括:
9.根据权利要求8所述的方法,其中,质量对比结果包含:表示所述预测总结文本质量高于所述原始总结文本质量的第一结果、表示所述预测总结文本质量低于所述原始总结文本质量的第二结果以及表示所述预测总结文本质量与所述原始总结文本质量相同的第三结果;
10.根据权利要求9所述的方法,其中,所述至少一次将所述预测总结文本和原始总结文本输入质量对比模型,包括:
11.根据权利要求7所述的方法,还包括:
12.根据权利要求11所述的方法,其中,所述对所述预测总结文本进行分词处理,得到第一分词结果,对所述真实总结文本进行分词处理,得到第二分词结果,统计目标分词的数量与分词总数量之间的比例,作为所述评估结果,包括:
13.根据权利要求11所述的方法,其中,所述获得所述第二样本文本对应的真实总结文本,包括:
14.根据权利要求1-6中任一项所述的方法,其中,所述获取第一样本文本,包括:
15.根据权利要求1-6中任一项所述的方法,其中,所述第二文本生成模型属于大语言模型,且所述第一文本生成模型的模型规模大于所述第二文本生成模型的模型规模。
16.一种文本生成模型训练装置,包括:
17.根据权利要求16所述的装置,其中,所述质量提升模块,具体用于:
18.根据权利要求16所述的装置,其中,还包括:
19.根据权利要求18所述的装置,其中,所述质量提升模块,具体用于:
20.根据权利要求16所述的装置,其中,所述第一模型推理模块,包括:
21.根据权利要求20所述的装置,其中,
22.根据权利要求16-21中任一项所述的装置,还包括:
23.根据权利要求22所述的装置,所述效果评估模块,包括:
24.根据权利要求23所述的装置,其中,质量对比结果包含:表示所述预测总结文本质量高于所述原始总结文本质量的第一结果、表示所述预测总结文本质量低于所述原始总结文本质量的第二结果以及表示所述预测总结文本质量与所述原始总结文本质量相同的第三结果;
25.根据权利要求24所述的装置,其中,所述质量对比单元,具体用于:
26.根据权利要求22所述的装置,还包括:
27.根据权利要求26所述的装置,其中,所述第一评估子模块,具体用于:
28.根据权利要求26所述的装置,其中,所述文本获得模块,具体用于:
29.根据权利要求16-21中任一项所述的装置,其中,所述文本获取模块,具体用于:
30.根据权利要求16-21中任一项所述的装置,其中,所述第二文本生成模型属于大语言模型,且所述第一文本生成模型的模型规模大于所述第二文本生成模型的模型规模。
31.一种电子设备,包括:
32.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-15中任一项所述的方法。
33.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-15中任一项所述的方法。
技术总结本公开提供了一种文本生成模型训练方法及装置,涉及数据处理技术领域,特别涉及自然语言处理技术领域。具体实现方案为:获取第一样本文本;将所述第一样本文本输入已训练的第一文本生成模型,得到所述第一文本生成模型输出的初始总结文本;对所述初始总结文本进行质量提升处理,得到目标总结文本;将所述第一样本文本以及所述目标总结文本作为训练数据,对第二文本生成模型进行模型训练,得到训练后的第二文本生成模型。应用本公开实施例提供的方案,能够提高模型训练效果。技术研发人员:宋永浩,裴中佑,施鹏受保护的技术使用者:北京百度网讯科技有限公司技术研发日:技术公布日:2024/11/4本文地址:https://www.jishuxx.com/zhuanli/20241106/322305.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。