语音数据处理方法、装置、电子设备及存储介质与流程
- 国知局
- 2024-06-21 11:52:03
本申请涉及音频处理,更具体地,涉及一种语音数据处理方法、装置、电子设备及存储介质。
背景技术:
1、随着数据处理技术的发展和应用的广泛,音频修复和恢复已成为音频处理领域中的一项重要技术。音频修复和恢复可以通过降噪、去除杂音、修复损坏部分等手段,提升音频的质量和还原度。然而,目前的音频修复和恢复的效果还有待提升。
技术实现思路
1、本申请提出了一种语音数据处理方法、装置、电子设备及存储介质,以改善上述问题。
2、第一方面,本申请实施例提供了一种语音数据处理方法,所述方法包括:获取待恢复语音数据,所述待恢复语音数据包括第一语音数据以及第二语音数据,所述第一语音数据为通过第一语音处理方式对预设语音进行处理后得到的语音数据,所述第二语音数据为通过第二语音处理方式对预设语音进行处理后得到的语音数据,所述第一语音数据包括对应于所述预设语音的第一时间戳,所述第二语音数据包括对应于所述预设语音的第二时间戳;将所述第一时间戳与所述第二时间戳进行对齐;若对齐后所述第一语音数据包括的字数与所述第二语音数据包括的字数相同,将所述第一语音数据以及所述第二语音数据逐字进行频谱对比,并获取与所述预设语音对应的目标频谱;基于所述目标频谱获取目标语音。
3、第二方面,本申请实施例提供了一种语音数据处理装置,所述装置包括:待处理数据获取模块,用于获取待恢复语音数据,所述待恢复语音数据包括第一语音数据以及第二语音数据,所述第一语音数据为通过第一语音处理方式对预设语音进行处理后得到的语音数据,所述第二语音数据为通过第二语音处理方式对预设语音进行处理后得到的语音数据,所述第一语音数据包括对应于所述预设语音的第一时间戳,所述第二语音数据包括对应于所述预设语音的第二时间戳;时间戳对齐模块,用于将所述第一时间戳与所述第二时间戳进行对齐;目标频谱获取模块,用于若对齐后所述第一语音数据包括的字数与所述第二语音数据包括的字数相同,将所述第一语音数据以及所述第二语音数据逐字进行频谱对比,并获取与所述预设语音对应的目标频谱;目标语音获取模块,用于基于所述目标频谱获取目标语音。
4、第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个应用程序配置用于执行上述第一方面提供的语音数据处理方法。
5、第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述第一方面提供的语音数据处理方法。
6、本申请提供的一种语音数据处理方法、装置、电子设备及存储介质,通过获取待恢复语音数据,所述待恢复语音数据包括第一语音数据以及第二语音数据,所述第一语音数据为通过第一语音处理方式对预设语音进行处理后得到的语音数据,所述第二语音数据为通过第二语音处理方式对预设语音进行处理后得到的语音数据,所述第一语音数据包括对应于所述预设语音的第一时间戳,所述第二语音数据包括对应于所述预设语音的第二时间戳;将所述第一时间戳与所述第二时间戳进行对齐;若对齐后所述第一语音数据包括的字数与所述第二语音数据包括的字数相同,将所述第一语音数据以及所述第二语音数据逐字进行频谱对比,并获取与所述预设语音对应的目标频谱;基于所述目标频谱获取目标语音。从而通过上述方式实现了可以在针对相同语音经过不同的语音处理得到的两条语音数据的时间戳对齐的情况下,逐字频谱对比二者的差异,以实现准确的获取待恢复语音的频谱,进而基于该频谱确定出待恢复的语音内容,可以提升语音恢复的准确性与可靠性,进而提升音频恢复效果。
技术特征:1.一种语音数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取与所述预设语音对应的目标频谱,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述相似度确定与预设语音对应的目标频谱,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一频谱确定方式包括:基于所述第一语音数据中的字与其对应的第一置信度、和所述第二语音数据中的字与其对应的第二置信度获取与预设语音对应的目标频谱;
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一语音数据中的字与其对应的第一置信度、和所述第二语音数据中的字与其对应的第二置信度获取与预设语音对应的目标频谱,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述相似度确定与预设语音对应的目标频谱,包括:
8.根据权利要求7所述的方法,其特征在于,所述第三频谱确定方式包括:
9.根据权利要求8所述的方法,其特征在于,所述对于频谱缺失的部分,基于所述第一语音数据中的字与其对应的第一置信度以及第三置信度、和基于所述第二语音数据中的字与其对应的第二置信度与第四置信度确定缺失部分的频谱,包括:
10.一种语音数据处理装置,其特征在于,所述装置包括:
11.一种电子设备,其特征在于,包括一个或多个处理器以及存储器;
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,其中,在所述程序代码被处理器运行时执行权利要求1-9任一所述的方法。
技术总结本申请公开了一种语音数据处理方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:获取待恢复语音数据,待恢复语音数据包括第一语音数据以及第二语音数据,第一语音数据包括对应于预设语音的第一时间戳,第二语音数据包括对应于预设语音的第二时间戳;将第一时间戳与第二时间戳进行对齐;若对齐后第一语音数据包括的字数与第二语音数据包括的字数相同,将第一语音数据以及第二语音数据逐字进行频谱对比,并获取与预设语音对应的目标频谱;基于目标频谱获取目标语音。本方法实现了提升语音恢复的准确性与可靠性,进而提升音频恢复效果。技术研发人员:黄润乾,陈东鹏,张伟彬,李亚桐受保护的技术使用者:深圳市声扬科技有限公司技术研发日:技术公布日:2024/5/16本文地址:https://www.jishuxx.com/zhuanli/20240618/24100.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表