技术新讯 > 电子通信装置的制造及其应用技术 > 直播内容生成、直播内容生成模型训练方法及装置与流程  >  正文

直播内容生成、直播内容生成模型训练方法及装置与流程

  • 国知局
  • 2024-08-02 14:01:04

本发明涉及自然语言处理,尤其涉及一种直播内容生成、直播内容生成模型训练方法及装置。

背景技术:

1、直播内容生成是指为直播活动撰写和创作各种文字内容,以吸引观众、传达信息、引起兴趣和推广产品或服务。

2、目前,多依赖文案撰写人员编写直播内容,但该方法需要耗费大量时间和精力,增加人力成本,无法满足快速发布直播的需求,而且不同文案撰写人员可能有不同的风格和偏好,导致编写的直播内容表达不准确或缺乏吸引力。此外,由于人工编写的限制,很难根据观众的个性化特征和偏好,量身定制直播内容,无法实现精准推荐和个性化营销。

技术实现思路

1、本发明提供一种直播内容生成、直播内容生成模型训练方法及装置,用以解决现有技术中直播内容生成效率较低,成本较高且无法满足观众个性化需求的缺陷。

2、本发明提供一种直播内容生成方法,包括:

3、确定直播主题信息;

4、将所述直播主题信息输入至直播内容生成模型,得到所述直播内容生成模型输出的所述直播主题信息对应的直播内容;

5、所述直播内容生成模型训练的损失值基于预测直播内容与样本直播内容之间的差异,以及用户对所述预测直播内容的打分值确定,所述预测直播内容是所述直播内容生成模型的预训练模型基于样本直播主题信息预测得到的直播内容。

6、根据本发明提供的一种直播内容生成方法,所述直播内容生成模型的训练步骤包括:

7、获取电商领域的文本语料,并基于所述文本语料对初始模型进行预训练,得到预训练模型;

8、基于所述预训练模型,应用所述样本直播主题信息,得到所述预测直播内容;

9、基于所述预测直播内容与所述样本直播内容之间的差异,以及所述预测直播内容的打分值,对所述预训练模型进行训练,得到所述直播内容生成模型。

10、根据本发明提供的一种直播内容生成方法,所述获取电商领域的文本语料,包括:

11、获取电商领域的候选文本语料;

12、基于同一商品品类下各细分子类对应候选文本语料的数量,和/或,所述候选文本语料中各分词的频次分布,从所述候选文本语料中剔除异常语料,得到所述文本语料。

13、根据本发明提供的一种直播内容生成方法,基于同一商品品类下各细分子类对应候选文本语料的数量,从所述候选文本语料中剔除异常语料,包括:

14、基于同一商品品类下各细分子类对应候选文本语料的数量,确定对应商品品类下各细分子类的语料数量分布范围,并在任一细分子类对应候选文本语料的数量超出所述语料数量分布范围的情况下,将所述任一细分子类对应候选文本语料作为异常语料剔除。

15、根据本发明提供的一种直播内容生成方法,基于所述候选文本语料中各分词的频次分布,从所述候选文本语料中剔除异常语料,包括:

16、在任一分词的频次分布超出预设频次分布范围的情况下,将所述任一分词所在候选文本语料作为异常语料剔除。

17、根据本发明提供的一种直播内容生成方法,所述候选文本语料是对初始文本语料进行文本质量筛选后得到的。

18、根据本发明提供的一种直播内容生成方法,所述基于所述文本语料对所述初始模型进行预训练,得到预训练模型,包括:

19、确定多个不同的训练任务;

20、在各训练任务下,基于所述文本语料,对所述初始模型进行预训练,得到所述预训练模型。

21、根据本发明提供的一种直播内容生成方法,所述基于所述预测直播内容与所述样本直播内容之间的差异,以及所述预测直播内容的打分值,对所述预训练模型进行训练,得到所述直播内容生成模型,包括:

22、基于所述预测直播内容的打分值,确定奖励值;

23、基于所述预测直播内容与所述样本直播内容之间的差异,以及所述奖励值,确定所述直播内容生成模型的损失值;

24、基于所述损失值,对所述预训练模型进行训练,得到所述直播内容生成模型。

25、根据本发明提供的一种直播内容生成方法,所述基于所述预测直播内容与所述样本直播内容之间的差异,以及所述预测直播内容的打分值,对所述预训练模型进行训练,得到所述直播内容生成模型,包括:

26、基于所述预测直播内容与所述样本直播内容之间的差异,对所述预训练模型进行有监督训练,得到直播文案生成模型;

27、基于所述预测直播内容的打分值,对所述直播文案生成模型进行强化学习,得到所述直播内容生成模型。

28、根据本发明提供的一种直播内容生成方法,所述方法还包括:

29、在对所述预训练模型进行训练的过程中,基于所述样本直播内容的文本长度、字符种类数量以及语法结构中的至少一种,调整所述预训练模型的权重。

30、根据本发明提供的一种直播内容生成方法,所述得到所述直播内容生成模型,之后还包括:对所述直播内容生成模型进行量化处理。

31、根据本发明提供的一种直播内容生成方法,所述样本直播内容的确定步骤包括:

32、获取所述样本直播主题信息对应的多个候选直播内容;

33、基于各候选直播内容的语言风格、语言表达准确性以及营销效果中的至少一种,确定各候选直播内容的质量评分;

34、将质量评分大于阈值的候选直播内容作为所述样本直播内容。

35、本发明还提供一种直播内容生成模型训练方法,包括:

36、获取样本直播主题信息以及对应的样本直播内容;

37、基于预测直播内容与所述样本直播内容之间的差异,以及用户对所述预测直播内容的打分值,对预训练模型进行训练,得到直播内容生成模型,所述预测直播内容是所述预训练模型基于样本直播主题信息预测得到的直播内容。

38、本发明还提供一种直播内容生成装置,包括:

39、第一确定单元,用于确定直播主题信息;

40、内容生成单元,用于将所述直播主题信息输入至直播内容生成模型,得到所述直播内容生成模型输出的所述直播主题信息对应的直播内容;

41、所述直播内容生成模型训练的损失值基于预测直播内容与样本直播内容之间的差异,以及用户对所述预测直播内容的打分值确定,所述预测直播内容是所述直播内容生成模型的预训练模型基于样本直播主题信息预测得到的直播内容。

42、本发明还提供一种直播内容生成模型训练装置,包括:

43、信息获取单元,用于获取样本直播主题信息以及对应的样本直播内容;

44、模型训练单元,用于基于预测直播内容与所述样本直播内容之间的差异,以及用户对所述预测直播内容的打分值,对预训练模型进行训练,得到直播内容生成模型,所述预测直播内容是所述预训练模型基于样本直播主题信息预测得到的直播内容。

45、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述直播内容生成方法,或实现如上述任一种所述直播内容生成模型训练方法。

46、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述直播内容生成方法,或实现如上述任一种所述直播内容生成模型训练方法。

47、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述直播内容生成方法,或实现如上述任一种所述直播内容生成模型训练方法。

48、本发明提供的直播内容生成、直播内容生成模型训练方法及装置,由于直播内容生成模型训练的损失值基于预测直播内容与样本直播内容之间的差异,以及用户对预测直播内容的打分值确定,即在直播内容生成模型的训练过程中,不仅考虑了生成直播内容的质量,而且考虑了所生成直播内容是否贴合用户喜好,从而训练完成的直播内容生成模型不仅能够快速输出较高质量的直播内容,而且所输出的直播内容贴合用户喜好,进而能够增强用户体验。

本文地址:https://www.jishuxx.com/zhuanli/20240801/241374.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。