一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本复述模型的训练方法、文本复述方法和装置与流程

2022-07-31 00:29:21 来源:中国专利 TAG:

技术特征:
1.一种文本复述模型的训练方法,包括:获取训练文本对,所述训练文本对包括原始训练文本和复述训练文本;为所述复述训练文本生成词汇控制条件和语法控制条件;将所述原始训练文本、所述词汇控制条件和所述语法控制条件输入待训练的文本复述模型,得到所述文本复述模型输出的复述预测文本;基于所述复述预测文本和所述复述训练文本之间的差异,更新所述文本复述模型的参数,以对所述文本复述模型进行训练;其中,所述文本复述模型包括预训练的语言模型和解码器,所述预训练的语言模型用于以所述词汇控制条件和所述语法控制条件为约束,对所述原始训练文本进行语义编码,输出所述原始训练文本的语义表征向量,所述解码器用于基于所述语义表征向量进行复述文本的预测,输出复述预测文本。2.根据权利要求1所述的方法,所述语法控制条件为复述样例文本;所述为所述复述训练文本生成语法控制条件,包括:为所述复述训练文本生成截断线性化成分树lct;在范例字典中查找所述截断lct匹配的复述样例文本,作为所述复述训练文本的语法控制条件;其中,所述范例字典中包括截断lct与复述样例文本之间的映射关系。3.根据权利要求2所述的方法,所述在范例字典中查找所述截断lct匹配的复述样例文本,包括:计算所述复述训练文本的截断lct与所述范例字典中各截断lct之间的语法编辑距离;将所述范例字典中计算得到最小语法编辑距离的截断lct对应的复述样例文本确定为所述匹配的复述样例文本。4.根据权利要求2所述的方法,所述范例字典的生成方法,包括:为各训练文本对中的复述训练文本生成截断lct,得到截断lct和复述训练文本之间的映射关系;针对每个截断lct,在所述截断lct对应多个复述训练文本的情况下,从中选择一个复述训练文本作为复述样例文本;在所述截断lct对应一个复述训练文本的情况下,将所述复述训练文本确定为复述样例文本;基于所述截断lct与所述复述样例文本之间的映射关系生成范例字典。5.根据权利要求2所述的方法,所述为所述复述训练文本生成截断lct,包括:为所述复述训练文本生成lct;过滤掉所述lct中叶子节点词性,得到截断lct。6.根据权利要求1所述的方法,所述为所述复述训练文本生成词汇控制条件,包括:采用关键词抽取算法从所述复述训练文本中抽取出关键词,作为所述复述训练文本的词汇控制条件。7.根据权利要求1所述的方法,所述语法控制条件包括:所述复述训练文本的词性标注、lct、语法框架模板和复述样例文本中的一种,所述文本复述模型对应于所述语法控制条件。8.一种文本复述方法,包括:获取待复述文本和所述待复述文本的控制条件;
将所述待复述文本和所述控制条件输入已训练的文本复述模型,得到所述文本复述模型输出的文本复述结果;其中,所述文本复述模型基于权利要求1-7中任一项所述的方法训练。9.根据权利要求8所述的方法,所述控制条件包括词汇控制条件和语法控制条件,所述已训练的文本复述模型与所述语法控制条件对应。10.一种文本复述模型的训练装置,包括:样本获取单元,获取训练文本对,所述训练文本对包括原始训练文本和复述训练文本;条件生成单元,为所述复述训练文本生成词汇控制条件和语法控制条件;模型输入单元,将所述原始训练文本、所述词汇控制条件和所述语法控制条件输入待训练的文本复述模型,得到所述文本复述模型输出的复述预测文本;参数更新单元,基于所述复述预测文本和所述复述训练文本之间的差异,更新所述文本复述模型的参数,以对所述文本复述模型进行训练;其中,所述文本复述模型包括预训练的语言模型和解码器,所述预训练的语言模型用于以所述词汇控制条件和所述语法控制条件为约束,对所述原始训练文本进行语义编码,输出所述原始训练文本的语义表征向量,所述解码器用于基于所述语义表征向量进行复述文本的预测,输出复述预测文本。11.一种文本复述装置,包括:文本获取单元,获取待复述文本和所述待复述文本的控制条件;文本复述单元,将所述待复述文本和所述控制条件输入已训练的文本复述模型,得到所述文本复述模型输出的文本复述结果;其中,所述文本复述模型基于权利要求1-7中任一项所述的方法训练。12.一种文本复述模型的训练装置,包括:处理器;用于存储机器可执行指令的存储器;其中,通过读取并执行所述存储器存储的与文本复述模型的训练逻辑对应的机器可执行指令,所述处理器被促使:获取训练文本对,所述训练文本对包括原始训练文本和复述训练文本;为所述复述训练文本生成词汇控制条件和语法控制条件;将所述原始训练文本、所述词汇控制条件和所述语法控制条件输入待训练的文本复述模型,得到所述文本复述模型输出的复述预测文本;基于所述复述预测文本和所述复述训练文本之间的差异,更新所述文本复述模型的参数,以对所述文本复述模型进行训练;其中,所述文本复述模型包括预训练的语言模型和解码器,所述预训练的语言模型用于以所述词汇控制条件和所述语法控制条件为约束,对所述原始训练文本进行语义编码,输出所述原始训练文本的语义表征向量,所述解码器用于基于所述语义表征向量进行复述文本的预测,输出复述预测文本。13.一种文本复述装置,包括:处理器;
用于存储机器可执行指令的存储器;其中,通过读取并执行所述存储器存储的与文本复述逻辑对应的机器可执行指令,所述处理器被促使:获取待复述文本和所述待复述文本的控制条件;将所述待复述文本和所述控制条件输入已训练的文本复述模型,得到所述文本复述模型输出的文本复述结果;其中,所述文本复述模型基于权利要求1-7中任一项所述的方法训练。

技术总结
说明书披露一种文本复述模型的训练方法、文本复述方法和装置。所述文本复述模型的训练方法包括:获取训练文本对,所述训练文本对包括原始训练文本和复述训练文本;为所述复述训练文本生成词汇控制条件和语法控制条件;将所述原始训练文本、所述词汇控制条件和所述语法控制条件输入待训练的文本复述模型,得到所述文本复述模型输出的复述预测文本;基于所述复述预测文本和所述复述训练文本之间的差异,更新所述文本复述模型的参数,以对所述文本复述模型进行训练。模型进行训练。模型进行训练。


技术研发人员:杨可心 刘大一恒 姚亮 杨宝嵩 张海波 陈博兴 谢军
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:2022.03.30
技术公布日:2022/7/29
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献