一种演唱清晰度检测方法、存储介质和电子设备与流程
- 国知局
- 2024-06-21 11:51:39
本申请涉及计算机,特别涉及一种演唱清晰度检测方法、存储介质和电子设备。
背景技术:
1、当前,歌唱软件的音准打分可以有效检测用户演唱是否在调上,但是实际场景中遇到部分用户并非认真开口唱,而是通过哼唱的方式来获取高分。而在用户哼唱时,其声带实际未发生振动,即哼唱的过程中激励源仍然在工作,但声道模型保持相对固定,所以哼唱的方式会有基频。依然可以得到一个比较高的音准打分。但当前无法针对此行为依赖于音准打分,或者其他的一些已知的音频特征,简单快速的判断用户是否有开口认真唱。
技术实现思路
1、本申请的目的是提供一种演唱清晰度检测方法、存储介质和电子设备,能够检测用户歌唱时是否清晰,避免通过哼唱获得高分。
2、为解决上述技术问题,本申请提供一种演唱清晰度检测方法,具体技术方案如下:
3、获取目标歌曲的演唱歌词文本,确定所述演唱歌词文本的第一标注序列;
4、获取所述目标歌曲的演唱语音数据,确定所述演唱语音数据的第二标注序列;
5、将所述第一标注序列和所述第二标注序列转化为对应的第一音素序列和第二音素序列;
6、根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离;所述编辑操作包括删除操作、插入操作和替换操作;所述编辑距离用于指示演唱清晰度,且所述编辑距离越小,演唱清晰度越高。
7、可选的,所述获取演唱歌词文本,确定所述演唱歌词文本的第一标注序列后,还包括:
8、根据所述第一标注序列对所述二标注序列进行字符串去重。
9、可选的,所述获取演唱语音数据,确定所述演唱语音数据的第二标注序列包括:
10、获取演唱语音数据,将所述演唱语音数据输入语音转文字模型,得到文字识别结果;其中,所述语音转文字模型的训练数据集中包含所述目标歌曲的标准歌唱数据;
11、根据所述文字识别结果确定所述演唱语音数据的第二标注序列。
12、可选的,将所述演唱语音数据输入语音转文字模型前,还包括:
13、根据歌词文本对所述演唱语音数据分段,得到分段语音数据;
14、则将所述演唱语音数据输入语音转文字模型包括:
15、将所述分段语音数据按时间顺序依次输入至语音转文字模型。
16、可选的,将所述第一标注序列和所述第二标注序列转化为对应的第一音素序列和第二音素序列包括:
17、将所述第一标注序列中的英文和数字转化为对应的中文,执行长元音合并去重,得到第一音素序列;
18、将所述第二标注序列中的英文和数字转化为对应的中文,执行长元音合并去重,得到第二音素序列。
19、可选的,根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离之前,还包括:
20、确定所述目标歌曲的歌曲类型,并根据所述歌曲类型确定所述编辑系数。
21、可选的,根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离包括:
22、确定所述第一音素序列的第一音素数,所述第二音素序列的第二音素数;
23、配置各所述编辑操作的编辑系数;
24、根据所述第一音素数、所述第二音素数和所述编辑操作构建状态转移方程;所述状态转移方程用于计算所述编辑距离。
25、可选的,根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离时,还包括:
26、确定演唱清晰度计算模式;
27、根据所述演唱清晰度计算模式调节所述替换操作的编辑系数。
28、本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法的步骤。
29、本申请还提供一种服务器,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上所述的方法的步骤。
30、本申请提供一种演唱清晰度检测方法,包括:获取目标歌曲的演唱歌词文本,确定所述演唱歌词文本的第一标注序列;获取所述目标歌曲的演唱语音数据,确定所述演唱语音数据的第二标注序列;将所述第一标注序列和所述第二标注序列转化为对应的第一音素序列和第二音素序列;根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离;所述编辑操作包括删除操作、插入操作和替换操作;所述编辑距离用于指示演唱清晰度,且所述编辑距离越小,演唱清晰度越高。
31、本申请在获取到用户的演唱语音数据时,通过获取目标歌曲的演唱语音数据和演唱歌词文本,将二者转化为对应的音素序列后,通过确定根据第一音素序列和第二音素序列之间的编辑操作数量以及各编辑操作的编辑系数确定编辑距离,以准确反馈用户演唱的清晰度,避免用户通过哼唱得到较高的音准评价,有效检测用户哼唱行为,能为用户提供客观公正的歌唱评价。
32、本申请还提供一种计算机可读存储介质和电子设备,具有上述有益效果,此处不再赘述。
技术特征:1.一种演唱清晰度检测方法,其特征在于,包括:
2.根据权利要求1所述的演唱清晰度检测方法,其特征在于,所述获取演唱歌词文本,确定所述演唱歌词文本的第一标注序列后,还包括:
3.根据权利要求1所述的演唱清晰度检测方法,其特征在于,所述获取演唱语音数据,确定所述演唱语音数据的第二标注序列包括:
4.根据权利要求3所述的演唱清晰度检测方法,其特征在于,将所述演唱语音数据输入语音转文字模型前,还包括:
5.根据权利要求1所述的演唱清晰度检测方法,其特征在于,将所述第一标注序列和所述第二标注序列转化为对应的第一音素序列和第二音素序列包括:
6.根据权利要求1所述的演唱清晰度检测方法,其特征在于,根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离之前,还包括:
7.根据权利要求6所述的演唱清晰度检测方法,其特征在于,根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离包括:
8.根据权利要求1所述的演唱清晰度检测方法,其特征在于,根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离时,还包括:
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一项所述的演唱清晰度检测方法的步骤。
10.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1-8任一项所述的演唱清晰度检测方法的步骤。
技术总结本申请提供一种演唱清晰度检测方法,包括:获取目标歌曲的演唱歌词文本,确定所述演唱歌词文本的第一标注序列;获取所述目标歌曲的演唱语音数据,确定所述演唱语音数据的第二标注序列;将所述第一标注序列和所述第二标注序列转化为对应的第一音素序列和第二音素序列;根据所述第一音素序列和所述第二音素序列之间的编辑操作数量以及各所述编辑操作的编辑系数确定编辑距离;所述编辑操作包括删除操作、插入操作和替换操作;所述编辑距离用于指示演唱清晰度,且所述编辑距离越小,演唱清晰度越高。本申请可以有效检测用户哼唱行为,能为用户提供客观公正的歌唱评价。本申请还提供一种计算机可读存储介质和电子设备,具有上述有益效果。技术研发人员:李博文受保护的技术使用者:腾讯音乐娱乐科技(深圳)有限公司技术研发日:技术公布日:2024/5/12本文地址:https://www.jishuxx.com/zhuanli/20240618/24045.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表