一种基于大模型实现多语言智能语音质检系统的制作方法
- 国知局
- 2024-09-14 15:09:43
本发明涉及语音质检,尤其涉及一种基于大模型实现多语言智能语音质检系统。
背景技术:
1、传统的语音质检系统是一种高效的工具,它通过采集上游系统的语音文件以及业务数据,然后利用自动分案或人工分案的方式进行系统作业,以确保语音质量的优良和业务操作的准确无误。这样的系统,不仅能大大提高工作效率,还能减少因人为错误导致的问题。
2、公开号为cn118072764a的中国专利公开了一种智能语音质检管理系统,语音质检模型组件管理模块,其内设置有多个语音质检模型组件,每个语音质检模型组件内设置有根据所述业务关键词构建的所属业务对应的多重质检规则。语音质检模块,用于实时调用所属业务的语音质检模型组件对待质检的语音文本数据进行语音质检,并输出质检结果。与现有技术相比,本发明质检场景适用性高、质检精准性高。
3、但是上述已公开方案存在如下不足之处:只能适用于单一类型的语音输入,无法实现多类语音质检,另外,语音质检模型组件通过关键字进行质检,质检手段单一,无法分析用户说话时的情感,导致语音质检效果较差。
技术实现思路
1、本发明目的是针对背景技术中存在的无法实现多类型的语音质检,且语音质检效果较差的问题,提出一种基于大模型实现多语言智能语音质检系统。
2、本发明的技术方案:一种基于大模型实现多语言智能语音质检系统,包括:
3、语音采集模块,用来从语音输入设备采集语音信号,语音信号是多种语言的语音信号;
4、语音识别模块,用来接收语音采集模块采集的语音信号,进行预处理,并将其转换为相应的文本数据,语音识别模块支持多种语言的识别;
5、质检模块,用来接收语音识别模块转换的文本数据,并进行质量检测,质量检测包括语法检查、情感分析和关键词提取。语法检查用来检查文本的语法错误,情感分析则是对文本的情感进行分析,关键词提取是从文本中提取关键词;通过情感分析得出情感分数es,再根据情感分数数值得出当前语音文本的局部情感;情感分数计算公式为,es=(evs+ees+tfs)/tl,其中evs为情感词汇得分之和,ees为情感表达方式得分,tfs为文本特征得分,tl为文本长度;
6、以及反馈模块,用来将质检模块的检测结果反馈给用户,帮助用户提升语音的质量。
7、优选的,还包括学习模块;通过学习,不断提升语音识别和质量检测的能力;学习模块还从反馈模块接收到的用户反馈中进行学习,以提高识别和检测的准确度。
8、优选的,语音采集模块使用语音信号处理技术,包括语音信号的采集、预处理和特征提取,采集通过麦克风或其他语音输入设备获取语音信号,预处理包括降噪、归一化操作,特征提取则是提取语音信号的特征参数。
9、优选的,语音识别模块使用深度学习技术,将语音信号转换为文本数据,这些模型需要进行训练。
10、优选的,质检模块中,情感词汇得分之和是根据情感词典计算出文本中情感词汇的得分总和;情感表达方式得分是根据文本中的情感表达方式进行打分;文本特征得分是根据提取出的文本特征对情感分析的贡献进行打分。
11、优选的,情感词汇得分之和的计算方式为,evs=σ(词汇情感值×词汇权重);其中,词汇情感值是根据情感词典中每个词汇的情感极性给出的值,词汇权重根据词汇在文本中的重要程度进行调整。
12、优选的,情感表达方式得分计算方式为,ees=σ(情感表达模式权重×情感表达模式匹配度);其中,情感表达模式权重是根据不同情感表达模式的显著性给出的值,情感表达模式匹配度是指文本中的情感表达模式与情感词典中定义的情感表达模式的匹配程度。
13、优选的,文本特征得分的计算方式为,tfs=σ(特征重要性×特征值);其中,特征重要性是根据文本特征对情感分析的贡献程度给出的值,特征值是根据特征提取算法从文本中提取出的特征值。
14、与现有技术相比,本发明具有如下有益的技术效果:可以实现多国家语言的语音质量检测,提高语音识别的准确性和质量检测的准确性,同时,通过反馈模块,可以帮助用户提升语音的质量,提升用户体验。此外,通过学习模块,系统可以不断学习和改进,提升系统的性能。另外,在语音质量检测方面,本发明可以有效地检测出语音中的语法错误,情感偏差,关键词缺失等问题,从而提高语音质检效果。
技术特征:1.一种基于大模型实现多语言智能语音质检系统,其特征在于,包括:
2.根据权利要求1所述的基于大模型实现多语言智能语音质检系统,其特征在于,还包括学习模块;通过学习,不断提升语音识别和质量检测的能力;学习模块还从反馈模块接收到的用户反馈中进行学习,以提高识别和检测的准确度。
3.根据权利要求1所述的基于大模型实现多语言智能语音质检系统,其特征在于,语音采集模块使用语音信号处理技术,包括语音信号的采集、预处理和特征提取,采集通过麦克风或其他语音输入设备获取语音信号,预处理包括降噪、归一化操作,特征提取则是提取语音信号的特征参数。
4.根据权利要求1所述的基于大模型实现多语言智能语音质检系统,其特征在于,语音识别模块使用深度学习技术,将语音信号转换为文本数据,这些模型需要进行训练。
5.根据权利要求1所述的基于大模型实现多语言智能语音质检系统,其特征在于,质检模块中,情感词汇得分之和是根据情感词典计算出文本中情感词汇的得分总和;情感表达方式得分是根据文本中的情感表达方式进行打分;文本特征得分是根据提取出的文本特征对情感分析的贡献进行打分。
6.根据权利要求5所述的基于大模型实现多语言智能语音质检系统,其特征在于,情感词汇得分之和的计算方式为,evs=σ(词汇情感值×词汇权重);其中,词汇情感值是根据情感词典中每个词汇的情感极性给出的值,词汇权重根据词汇在文本中的重要程度进行调整。
7.根据权利要求5所述的基于大模型实现多语言智能语音质检系统,其特征在于,情感表达方式得分计算方式为,ees=σ(情感表达模式权重×情感表达模式匹配度);其中,情感表达模式权重是根据不同情感表达模式的显著性给出的值,情感表达模式匹配度是指文本中的情感表达模式与情感词典中定义的情感表达模式的匹配程度。
8.根据权利要求5所述的基于大模型实现多语言智能语音质检系统,其特征在于,文本特征得分的计算方式为,tfs=σ(特征重要性×特征值);其中,特征重要性是根据文本特征对情感分析的贡献程度给出的值,特征值是根据特征提取算法从文本中提取出的特征值。
技术总结本发明涉及语音质检领域,具体为一种基于大模型实现多语言智能语音质检系统,其包括:语音采集模块,用来从语音输入设备采集语音信号;语音识别模块,用来接收语音信号,并将其转换为文本数据;质检模块,用来接收文本数据,并进行质量检测,质量检测包括语法检查、情感分析和关键词提取;以及反馈模块,用来将质检模块的检测结果反馈给用户。本发明可以实现多国家语言的语音质量检测,提高语音识别的准确性和质量检测的准确性。另外,在语音质量检测方面,本发明可以有效地检测出语音中的语法错误,情感偏差,关键词缺失等问题,从而提高语音质检效果。技术研发人员:吴飞飞受保护的技术使用者:上海创帧软件有限公司技术研发日:技术公布日:2024/9/12本文地址:https://www.jishuxx.com/zhuanli/20240914/297189.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。