一种基于自然语言处理的会议摘要生成系统的制作方法
- 国知局
- 2024-07-31 23:26:44
本申请涉及会议摘要生成,具体是一种基于自然语言处理的会议摘要生成系统。
背景技术:
1、随着现代办公科技的提升,线上会议日益普遍,随之带来的便是以音频或视频形式保存的会议记录,通信网络的延时增大了由专人进行会议记录的难度,但会后再专门找人进行整理则会额外增加人力物力成本。
技术实现思路
1、本申请的目的在于提供一种基于自然语言处理的会议摘要生成系统,以解决上述背景技术中提出的技术问题。
2、为实现上述目的,本申请公开了以下技术方案:
3、一种基于自然语言处理的会议摘要生成系统,包括:
4、发言人身份识别模块,所述发言人身份识别模块用于获取发言人信息,所述发言人信息包括发言人身份及其对应的职级;
5、文本处理模块,所述文本处理模块用于获取会议记录,并基于所述发言人信息中的发言人身份生成记录文本,所述记录文本包括发言人身份及其发言人对应的发言内容;
6、第一关键词生成模块,所述第一关键词生成模块用于基于自然语言处理技术根据会议主题生成第一关键词集;
7、第一摘要生成模块,所述第一摘要生成模块用于基于自然语言处理技术根据所述第一关键词集生成与所述记录文本对应的第一摘要;
8、第二关键词生成模块,所述第二关键词生成模块用于基于所述第一关键词集,将所述发言人对应的职级赋值后作为参考量,生成第二关键词集;
9、第二摘要生成模块,所述第二摘要生成模块用于基于自然语言处理技术根据所述第二关键词集生成与所述记录文本对应的第二摘要;
10、选用第一摘要或第二摘要中的任意一个作为当前会议的会议摘要。
11、作为优选,所述发言人身份识别模块还用于将所述发言人信息中的发言人身份及其对应的职级进行编号,其编号结果为1,2,3…n。
12、作为优选,所述文本处理模块还用于识别所述会议记录的类型,所述会议记录的类型包括视频、音频或文本中的任意一种或多种,当所述会议记录的类型是视频或音频时,对所述会议记录进行语音识别,生成所述记录文本;当所述会议记录的类型是文本时,直接生成所述记录文本。
13、作为优选,所述的所述第一关键词生成模块用于基于自然语言处理技术根据会议主题生成第一关键词集包括:
14、获取会议主题,所述第一关键词生成模块基于自然语言处理技术生成与所述会议主题相关的第一候选关键词集,对关键词进行编号,其编号结果为1,2,3,…i,并获取关键词与所述会议主题的关联程度fi;
15、在所述记录文本中,对所述第一候选关键词集中的关键词的出现次数进行计数,并将计数结果定义为gi;
16、计算第一关键词评分ji,ji=fi*gi,对所述第一关键词评分ji进行分析,在第一候选关键词集中提取满足条件的关键词,生成所述第一关键词集。
17、作为优选,所述获取关键词与所述会议主题的关联程度fi包括:所述第一关键词生成模块基于预设的关联程度表获取关键词与所述会议主题的关联程度fi。
18、作为优选,所述的对所述第一关键词评分ji进行分析包括:
19、预设第一关键词评价阈值m,当ji≥m时,表示编号为i的关键词可以作为当前会议的关键词,将其定义为第一候选关键词,并生成第一候选关键词集,否则表示编号为i的关键词不可以作为当前会议的关键词;
20、所述第一关键词生成模块将所述第一候选关键词集按照所述第一关键词评分ji从高到低进行排序,取所述第一候选关键词中的所述第一关键词评分ji高的a个关键词作为用于当前会议的关键词,并生成所述第一关键词集。
21、作为优选,所述的所述第二关键词生成模块用于基于所述第一关键词集,将所述发言人对应的职级赋值后作为参考量,生成第二关键词集包括:
22、所述第二关键词生成模块对所述记录文本按照发言人及其对应的发言内容进行拆分,得到发言人文本;
23、在所述发言人文本中,对所述第一关键词集中的关键词的出现次数进行计数,并将计数结果定义为ei,并对计数结果ei进行分析;
24、所述第二关键词生成模块基于所述发言人信息中的对应的职级获取对应的发言人权重dn;
25、计算第二关键词评分ki,ki=ji*ei*dn,对所述第二关键词评分ki进行分析,在第二候选关键词集中提取满足条件的关键词,生成所述第二关键词集。
26、作为优选,所述对计数结果ei进行分析包括:
27、预设第二关键词评价阈值r,当ei>r时,表示编号为i的关键词在编号为n的发言人的发言中可以作为关键词,否则表示编号为i的关键词在编号为n的发言人的发言中不可以作为关键词。
28、作为优选,所述的对所述第二关键词评分ki进行分析包括:
29、预设第三关键词评价阈值n,当ki≥n时,表示编号为i的关键词可以作为当前会议的关键词,将其定义为第二候选关键词,并生成第二候选关键词集,否则表示编号为i的关键词不可以作为当前会议的关键词;
30、所述第二关键词生成模块将所述第二候选关键词集按照所述第二关键词评分ki从高到低进行排序,取所述第二候选关键词中的所述第二关键词评分ki高的b个关键词作为用于当前会议的关键词,并生成所述第二关键词集。
31、有益效果:本申请的基于自然语言处理的会议摘要生成系统,通过发言人身份识别模块和文本处理模块实现了视频或音频格式的会议记录的转换,简化了会议记录整理的流程;通过第一关键词生成模块和第一摘要生成模块实现了根据会议主题提取会议摘要的功能;通过第二关键词生成模块和第二摘要生成模块实现了参考发言人职级的关键词优化,提高了会议摘要的质量,避免了不必要的人力物力的浪费。
技术特征:1.一种基于自然语言处理的会议摘要生成系统,其特征在于,包括:
2.根据权利要求1所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述发言人身份识别模块还用于将所述发言人信息中的发言人身份及其对应的职级进行编号,其编号结果为1,2,3…n。
3.根据权利要求2所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述文本处理模块还用于识别所述会议记录的类型,所述会议记录的类型包括视频、音频或文本中的任意一种或多种,当所述会议记录的类型是视频或音频时,对所述会议记录进行语音识别,生成所述记录文本;当所述会议记录的类型是文本时,直接生成所述记录文本。
4.根据权利要求3所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述的所述第一关键词生成模块用于基于自然语言处理技术根据会议主题生成第一关键词集包括:
5.根据权利要求4所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述获取关键词与所述会议主题的关联程度fi包括:所述第一关键词生成模块基于预设的关联程度表获取关键词与所述会议主题的关联程度fi。
6.根据权利要求4所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述的对所述第一关键词评分ji进行分析包括:
7.根据权利要求3所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述的所述第二关键词生成模块用于基于所述第一关键词集,将所述发言人对应的职级赋值后作为参考量,生成第二关键词集包括:
8.根据权利要求7所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述对计数结果ei进行分析包括:
9.根据权利要求7所述的基于自然语言处理的会议摘要生成系统,其特征在于,所述的对所述第二关键词评分ki进行分析包括:
技术总结本申请涉及会议摘要生成技术领域,公开了一种基于自然语言处理的会议摘要生成系统,包括:发言人身份识别模块,文本处理模块,第一关键词生成模块,第一摘要生成模块,第二关键词生成模块和第二摘要生成模块。本申请选用第一摘要或第二摘要中的任意一个作为当前会议的会议摘要。本申请,通过发言人身份识别模块和文本处理模块实现了视频或音频格式的会议记录的转换,简化了会议记录整理的流程;通过第一关键词生成模块和第一摘要生成模块实现了根据会议主题提取会议摘要的功能;通过第二关键词生成模块和第二摘要生成模块实现了参考发言人职级的关键词优化,提高了会议摘要的质量,避免了不必要的人力物力的浪费。技术研发人员:谢熠,许永柯受保护的技术使用者:广州兆熠数字科技有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/197603.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。