评测方法、评测装置与流程
- 国知局
- 2024-06-21 11:26:11
本公开涉及人工智能服务领域,更具体地涉及一种评测方法、一种评测装置、电子设备、计算机可读存储介质、以及一种计算机程序产品。
背景技术:
1、随着人工智能技术的快速发展,目前已经提出了与人工智能技术相结合的各项语音技术。而口语测评则是语音技术应用的最早的领域之一。同时随着中小学对普通话要求的不断提高,中文口语测评的应用也越来越广泛。相较于其他语种,中文口语除了拼音以外,还有声调的变化,因此进行中文口语测评的难度更大。
2、通常来讲,用于中文口语测评的神经网络模型往往涉及较大的计算量。而嵌入有这样的神经网络模型的、能够实时进行中文口语测评的应用往往需要消耗更大的内存、占用更大的计算和存储资源、同时往往在实时反馈时出现延迟。
3、因此需要对现有的用于中文口语测评的神经网络模型进行进一步的改进,以提高用于实时进行中文口语测评的应用的性能。
技术实现思路
1、本公开的实施例提供了一种评测方法、一种评测装置、设备和计算机可读存储介质。
2、本公开的实施例提供了一种评测方法,包括:获取评测文本以及与所述评测文本对应的中文音频;对所述评测文本进行扩充以获得扩充的评测文本,所述扩充的评测文本包括声母标识符、韵母标识符和声调标识符;基于所述中文音频和所述扩充的评测文本,利用声学模型确定声学特征;以及基于所述中文音频、所述扩充的评测文本以及所述声学特征,确定用于评测所述中文音频的发音和声调的评分。
3、本公开的实施例提供了一种评测装置,包括:获取模块,被配置为获取评测文本以及与所述评测文本对应的中文音频;扩充模块,被配置为对所述评测文本进行扩充以获得扩充的评测文本,所述扩充的评测文本包括声母标识符、韵母标识符和声调标识符;声学模块,被配置为基于所述中文音频和所述扩充的评测文本,利用声学模型确定声学特征,以及评分模块,被配置为基于所述中文音频、所述扩充的评测文本以及所述声学特征,确定用于评测所述中文音频的发音和声调的评分。
4、本公开的实施例提供了一种电子设备,包括:处理器;以及存储器,其中,所述存储器中存储有计算机可执行程序,当由所述处理器执行所述计算机可执行程序时,执行上述的方法。
5、本公开的实施例提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现上述方法。
6、根据本公开的另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个方面或者上述各个方面的各种可选实现方式中提供的方法。
7、本公开的实施例基于扩充的评测文本,实现了仅通过调用单个声学模型就能得到声调评分和发音评分两者。相较于传统的方案,本公开的实施例能够显著地降低声学模型在调用过程中所占用的内存,只需要调用一次声学模型即可实时地基于该调用获取音素边界,而无需调用多个声学模型。大幅度则减少了语音测评应用中可能出现的延迟现象,使得实时地对中文语音进行评测成为可能。
技术特征:1.一种评测方法,包括:
2.如权利要求1所述的方法,其中,所述对所述评测文本进行扩充以获得扩充的评测文本包括:
3.如权利要求1所述的方法,其中,所述基于所述中文音频和所述扩充的评测文本,利用声学模型确定声学特征包括:
4.如权利要求1所述的方法,其中,所述基于所述中文音频、所述扩充的评测文本以及所述声学特征,确定用于评测所述中文音频的发音和声调的评分包括:
5.如权利要求4所述的方法,其中,所述至少部分地基于所述扩充的评测文本中的每个音素的音素边界,确定用于评测所述中文音频的发音和声调的评分包括:
6.如权利要求5所述的方法,其中,所述确定每个音素对应的声调特征和发音特征包括:
7.如权利要求5所述的方法,其中,所述确定每个音素对应的声调特征和发音特征包括:
8.如权利要求6所述的方法,其中,由发音打分模块来确定每个音素对应的发音特征,所述发音打分模块的训练包括:
9.如权利要求6所述的方法,其中,由声调打分模块来确定每个音素对应的声调特征,所述声调打分模块的训练包括:
10.一种评测装置,包括:
11.一种电子设备,包括:
12.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现如权利要求1-9中的任一项所述的方法。
13.一种计算机程序产品,其包括计算机可读指令,所述计算机可读指令在被处理器执行时,使得所述处理器执行如权利要求1-9中任一项所述的方法。
技术总结公开了一种评测方法、一种评测装置、电子设备、计算机可读存储介质、以及一种计算机程序产品。所述评测方法,包括:获取评测文本以及与所述评测文本对应的中文音频;对所述评测文本进行扩充以获得扩充的评测文本,所述扩充的评测文本包括声母标识符、韵母标识符和声调标识符;基于所述中文音频和所述扩充的评测文本,利用声学模型确定声学特征;以及基于所述中文音频、所述扩充的评测文本以及所述声学特征,确定用于评测所述中文音频的发音和声调的评分。技术研发人员:杜鋆,杨晓飞受保护的技术使用者:苏州声通信息科技有限公司技术研发日:技术公布日:2024/2/6本文地址:https://www.jishuxx.com/zhuanli/20240618/21512.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表