一种基于大语言模型的体育媒体内容生成方法及系统与流程
- 国知局
- 2024-11-06 14:42:25
本发明属于体育人工智能领域,具体而言,涉及一种基于大语言模型的体育媒体内容生成方法及系统。
背景技术:
1、大语言模型近年来发展迅速,具有内容生成能力,结合代码解释器、成绩数据库冠军头衔名录、联网网页搜索、网站实时数据,生成体育媒体行业人员需要的准确比赛文案,大大提高工作效率。
2、目前体育媒体工作者,在每场比赛结束后,都需要根据运动员历史信息和本次成绩撰写媒体文案,需要收集运动员达标席位、赛事规则、重点运动员等信息;通常耗费大量时间去撰写,信息分散且难以理解,同时信息准确性难以保证,产出效率低,因此,要引入一种基于大语言模型的体育媒体内容生成方法及系统。
技术实现思路
1、本发明是基于上述技术问题,针对的体育人工智能提出的一种基于大语言模型的体育媒体内容生成方法及系统;不仅生成信息准确性保证,产出效率高,用时短的优势,而且信息更加高效和符合用户要求。
2、本发明是这样实现的:
3、本发明的提出一种基于大语言模型的体育媒体内容生成方法及系统,该方法应用了对话模块、词嵌入模块、工作流程编排模块、大语言模型、体育媒体数据库和审核发布模块;其特征在于,所述方法包括以下步骤:
4、步骤1:通过对话模块接收人员内容,词嵌入模块将人员内容生成需求转成单词组和词向量;
5、步骤2:工作流程编排模块对单词组和词向量进行检索计算处理,将多个检索数据整理成一个文本块;
6、步骤3:大语言模型根据文本块和人员内容生成需求并获得输出文案;
7、步骤4:审核发布模块对用户的输出文案进行审核编辑,对内容一键发布或接入平台自动发布;
8、步骤5:体育媒体数据库保留涉及用户的全部数据。
9、根据本发明方面的一种能够实现的方式,所述步骤1中通过对话模块接收人员内容,词嵌入模块将人员内容生成需求转成单词组和词向量具体操作方法包括:
10、对话模块接收人员发出的文字、语音和图片内容生成需求;对话模块使用设备场景包括但不限于智能手机、平板电脑、智能音响和台式计算机等;对话模块使用设备场景内容标记φβ,其中β=0,1,2,...,p;p为正整数,表示对话模块使用设备场景内容中β可取值的最大值;
11、词嵌入模块将人员内容生成需求,转换成单词组和词向量;使用jieba分词工具将包含关键词的文本块划分成单词组;基于tf-idf模型,判断一个单词组是否为关键词;训练词向量模型,将单词组映射到高维实数向量空间中,从而捕捉单词组之间的语义关系;基于词向量模型获取每个单词组相应的词向量。
12、根据本发明方面的一种能够实现的方式,所述步骤2工作流程编排模块对单词组和词向量进行检索计算处理,将多个检索数据整理成一个文本块操作方法包括:
13、工作流程编排模块根据用户生成需求调整工作流编排指令,对代码解释器、成绩数据库冠军头衔名录、联网网页搜索、网站实时数据工具进行处理顺序调整及删减;对单词组和词向量使用工作流编排进行相似度算法检索计算处理,得到多个检索数据相关文本块;将多个检索数据相关文本块整理成一个文本块;
14、需要说明的是,代码解释器是根据需求,进行代码生成、表格读取、数据计算、表格生成、代码运行等功能;成绩数据库冠军头衔名录是包含过往所有比赛成绩、运动员个人信息、比赛规则、冠军头衔、成绩排名等赛事信息;联网网页搜索是利用互联网搜索相关关键词的所有内容;网站实时数据是比赛成绩官网、成绩显示工具文件;
15、需要说明的是,在一具体实施例中,例如,用户提出问题“你通过实时网站成绩单帮我生成男子100米半决赛文案吗?”,工作流程编排模块根据问题,制定需要的工具及编排指令,编排指令为“网站实时数据—成绩数据库冠军头衔名录—代码解释器”;
16、在另一具体实施例中,例如,用户提出问题“你可以帮我搜索,所有挑战赛中关于男子100米世界纪录的内容吗?生成一个世界纪录总结”,编排指令为“联网网页搜索—成绩数据库冠军头衔名录—代码解释器”。
17、根据本发明方面的一种能够实现的方式,所述步骤3中大语言模型根据文本块和人员内容生成需求并获得输出文案操作方法包括:
18、使用用户个人历史文章训练大语言模型,学习文案风格、文风;
19、人员选择历史风格生成或自定义风格生成文案,将文本块和人员内容生成需求输入大语言模型;大语言模型根据文本块和人员内容生成需求输出生成文案;
20、需要说明的是,在一具体实施例中,例如,用户个人历史文章是“棋逢对手,精彩!2024世界田联钻石联赛奥斯陆站男子400米栏,两个46的成绩!张三46秒63创wl,继历史最强首秀后再度提升;李四赛季首秀46秒70,最后一个栏失误给了张三反超的机会;一场钻石联赛这个阵容,也是无与伦比;”,用户根据词性关系提示词prompt或微调技术fine-tuning训练大语言模型;
21、在另一具体实施例中,例如,用户选择自定义风格“时间+地点+比赛名称+项目+风速+人名+排名+成绩+头衔”生成内容。
22、根据本发明方面的一种能够实现的方式,所述步骤4中审核发布模块对用户的输出文案进行审核编辑,对内容一键发布或接入平台自动发布具体操作方法包括:
23、输出文案显示在审核发布模块;用户对内容时间、地点、人物、成绩、排名、风格等进行审核编辑;对审核内容标记为us,其中s=0,1,2,...,l;l为正整数,表示审核内容s可取值的最大值;审核人员无误后点击一键发布或接入媒体平台自动发布;
24、需要说明的是,在一具体实施例中,例如,用户输入问题“你可以根据实时网站成绩单帮我生成男子100米半决赛文案吗?”,大语言模型输出文案“新的亚洲纪录!当地时间8月1日,东京奥运会男子100米半决赛第三组(风速:+0.9m/s),张三跑出9秒83的成绩,刷新亚洲纪录,小组第一晋级决赛;李四小组第二,成绩9秒83;王五,成绩9秒84,欧洲纪录;在东京奥运会百米飞人大战中,张三获得了第6名的成绩,虽与奖牌无缘,但他却创造了历史,成为首位闯进奥运男子百米决赛的中国人,他再一次定义了“中国速度””,审核人员检查后,点击一键发布,同步更新媒体平台。
25、根据本发明方面的一种能够实现的方式,所述步骤5中体育媒体数据库保留涉及用户的全部数据操作方法包括:
26、体育媒体数据库应当完整地保存与用户相关的所有数据,包括但不限于个人资料、使用记录、偏好设置、互动历史等;通过前端采集、后端日志和第三方工具收集数据;使用关系型数据库、nosql数据库和数据仓库存储不同类型的数据;通过分区和索引优化性能,并定期备份数据且用户具有数据访问和删除的功能权限。
27、一种云端系统,大语言模型根据文本块和人员内容生成需求并获得输出文案;通过云端计算及分析对体育媒体内容生成。
28、基于上述任一方面,本发明的有益效果为:
29、本发明通过对话模块接收人员内容,词嵌入模块将人员内容生成需求转成单词组和词向量;工作流程编排模块对单词组和词向量进行检索计算处理,将多个检索数据整理成一个文本块;此方法一方面大幅提高工作效率和文案质量,使数据处理更加高效和符合用户要求;
30、本发明大语言模型根据文本块和人员内容生成需求并获得输出文案;审核发布模块对用户的输出文案进行审核编辑,对内容一键发布或接入平台自动发布;体育媒体数据库保留涉及用户的全部数据;此方法另一方面依据历史撰写风格和文笔自动生成体育赛事媒体文案,提高检索准确性和便捷性。
本文地址:https://www.jishuxx.com/zhuanli/20241106/323650.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
上一篇
电子设备和处理方法与流程
下一篇
返回列表