一种音质评估模型训练方法及装置与流程
- 国知局
- 2024-06-21 11:52:23
本公开涉及计算机领域,尤其涉及一种音质评估模型训练方法及装置。
背景技术:
1、语音是用户常用的信息传递方式,因此,为满足用户的各种语音表达需求,各种语音处理系统应运而生。例如,该类系统可以包括:用于增强语音信号的语音增强系统、用于语音传输的语音通信系统等。
2、在实际使用过程中,为维持或优化语音处理系统的性能,存在对语音处理系统输出的处理后语音进行音质评估的需求,在相关技术中,可以由用户通过主观评价的方式,对该处理后语音进行音质评估。
技术实现思路
1、本公开提供一种音质评估模型训练方法及装置,训练得到的音质评估模型能够对语音进行音质评估,且评估结果符合用户的主观评价。
2、根据本公开的第一方面,提供一种音质评估模型训练方法,包括:
3、对样本语音进行特征提取,以得到所述样本语音的语音特征,并获取用户基于所述样本语音而给出的标准语音质量评分;
4、将提取得到的语音特征作为待训练模型的输入,以对所述待训练模型进行参数调整,直至调整后的模型基于所述语音特征输出的语音质量评分与所述标准语音质量评分相符;
5、将调整后的模型确定为训练得到的音质评估模型。
6、根据本公开的第二方面,提供一种音质评估模型训练装置,包括:
7、提取单元,对样本语音进行特征提取,以得到所述样本语音的语音特征,并获取用户基于所述样本语音而给出的标准语音质量评分;
8、调整单元,将提取得到的语音特征作为待训练模型的输入,以对所述待训练模型进行参数调整,直至调整后的模型基于所述语音特征输出的语音质量评分与所述标准语音质量评分相符;
9、确定单元,将调整后的模型确定为训练得到的音质评估模型。
10、根据本公开的第三方面,提供一种电子设备,包括:
11、处理器;
12、用于存储处理器可执行指令的存储器;
13、其中,所述处理器通过运行所述可执行指令以实现如第一方面所述的方法。
14、根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面所述方法的步骤。
15、在本公开的技术方案中,可以优先获取用户基于样本语音而给出的标准语音质量评分,在此基础上,即可将样本语音的语音特征输入待训练模型,并对待训练模型进行不断调整,直至输出的语音质量评分与用户给出的标准语音质量评分相符。
16、应当理解的是,本公开的技术方案相当于以用户给出的语音质量评分为标准,训练用于语音质量评估的模型,这使得训练得到的音质评估模型的评估逻辑与用户的主观评估逻辑相近,进而使得基于该音质评估模型输出的语音质量评分与用户基于主观评价给出的评分接近,避免了相关技术中音质评估模型输出的语音质量评分与用户主观评价相差甚远的问题。
技术特征:1.一种音质评估模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述对样本语音进行特征提取,包括:
3.根据权利要求1所述的方法,其特征在于,所述对样本语音进行特征提取,包括:
4.根据权利要求1所述的方法,其特征在于,
5.根据权利要求1所述的方法,其特征在于,
6.根据权利要求1所述的方法,其特征在于,
7.根据权利要求1所述的方法,其特征在于,所述待训练模型采用一维深度残差网络架构。
8.根据权利要求1所述的方法,其特征在于,所述样本语音为基于待评估语音系统输出的有损语音。
9.根据权利要求1所述的方法,其特征在于,还包括:
10.一种音质评估模型训练装置,其特征在于,包括:
11.一种电子设备,其特征在于,包括:
12.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,该指令被处理器执行时实现如权利要求1-9中任一项所述方法的步骤。
技术总结本公开是关于一种音质评估模型训练方法及装置。其中,该方法包括:对样本语音进行特征提取,以得到所述样本语音的语音特征,并获取用户基于所述样本语音而给出的标准语音质量评分;将提取得到的语音特征作为待训练模型的输入,以对所述待训练模型进行参数调整,直至调整后的模型基于所述语音特征输出的语音质量评分与所述标准语音质量评分相符;将调整后的模型确定为训练得到的音质评估模型。技术研发人员:秦萌萌受保护的技术使用者:北京小米移动软件有限公司技术研发日:技术公布日:2024/5/16本文地址:https://www.jishuxx.com/zhuanli/20240618/24149.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表