一种音频重采样方法、装置、电子设备及存储介质与流程
- 国知局
- 2024-06-21 11:32:59
本申请涉及音频处理领域,尤其涉及一种音频重采样方法、装置、电子设备及存储介质。
背景技术:
1、在对会议谈话的音频文件进行语音识别时,由于音频来源不同且质量参差不齐,需要对其进行重采样处理,由于会议讨论实景中音频内容分布很复杂,普通重采样的方式无法很好的保障音频内容的质量。
2、现有技术多采用均匀采样方式对原始音频进行重采样,这样采样效率较低的同时,也没有很好的根据音频内容(即单位时间内的文字分布)进行有效的过滤,对于提取出音频中的文字未起到足够的作用。
技术实现思路
1、本申请提供了一种音频重采样方法、装置、电子设备及存储介质,可以过滤掉无效的音频内容,提高采样效率,同时,最大限度的保留了原始音频中的有效信息,便于后期进行文字转换工作。
2、根据本申请的一方面,提供了一种音频重采样方法,所述方法包括:
3、确定待进行重采样的原始音频的内容分布,建立所述原始音频的内容分布到预设的标准音频的内容分布的映射关系;
4、根据所述标准音频的采样方式以及所述映射关系设置重采样的采样点;
5、根据所述原始音频的内容分布将所述原始音频划分为不同的音频段,对不同的音频段进行不同尺度的抗混叠预处理;
6、根据所述重采样的采样点对抗混叠预处理后的原始音频进行重采样。
7、根据本申请的另一方面,提供了一种音频重采样种装置,所述装置包括:
8、映射关系建立模块,用于确定待进行重采样的原始音频的内容分布,建立所述原始音频的内容分布到预设的标准音频的内容分布的映射关系;
9、采样点设置模块,用于根据所述标准音频的采样方式以及所述映射关系设置重采样的采样点;
10、抗混叠预处理模块,用于根据所述原始音频的内容分布将所述原始音频划分为不同的音频段,对不同的音频段进行不同尺度的抗混叠预处理;
11、重采样模块,用于根据所述重采样的采样点对抗混叠预处理后的原始音频进行重采样。
12、根据本申请的另一方面,提供了一种电子设备,所述电子设备包括:
13、至少一个处理器;以及
14、与所述至少一个处理器通信连接的存储器;其中,
15、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的音频重采样方法。
16、根据本申请的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的音频重采样方法。
17、本申请实施例的技术方案,确定待进行重采样的原始音频的内容分布,建立原始音频的内容分布到预设的标准音频的内容分布的映射关系;根据标准音频的采样方式以及映射关系设置重采样的采样点;根据原始音频的内容分布将原始音频划分为不同的音频段,对不同的音频段进行不同尺度的抗混叠预处理;根据重采样的采样点对抗混叠预处理后的原始音频进行重采样。本申请实施例的技术方案,通过建立原始音频的内容分布到标准音频的内容分布的映射关系,为原始音频的重采样的采样点设置提供有效指导,可以过滤掉无效的音频内容,提高采样效率,同时,最大限度的保留了原始音频中的有效信息,便于后期进行文字转换工作。
18、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
技术特征:1.一种音频重采样方法,其特征在于,所述方法,包括:
2.根据权利要求1所述的方法,其特征在于,确定待进行重采样的原始音频的内容分布,建立所述原始音频的内容分布到预设的标准音频的内容分布的映射关系,包括:
3.根据权利要求2所述的方法,其特征在于,确定所述原始音频的文字内容随时间变化的原始分布函数,包括:
4.根据权利要求1所述的方法,其特征在于,根据所述标准音频的采样方式以及所述映射关系设置重采样的采样点,包括:
5.根据权利要求4所述的方法,其特征在于,根据所述标准音频的采样点以及所述映射关系设置重采样的采样点,包括:
6.根据权利要求1所述的方法,其特征在于,根据所述原始音频的内容分布将所述原始音频划分为不同的音频段,对不同的音频段进行不同尺度的抗混叠预处理,包括:
7.根据权利要求6所述的方法,其特征在于,根据所述单位时间内的语速确定对应的音频段的抗混叠预处理尺度,包括:
8.一种音频重采样装置,其特征在于,所述装置,包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的音频重采样方法。
技术总结本申请公开了一种音频重采样方法、装置、电子设备及存储介质。该方法包括:确定待进行重采样的原始音频的内容分布,建立原始音频的内容分布到预设的标准音频的内容分布的映射关系;根据标准音频的采样方式以及映射关系设置重采样的采样点;根据原始音频的内容分布将原始音频划分为不同的音频段,对不同的音频段进行不同尺度的抗混叠预处理;根据重采样的采样点对抗混叠预处理后的原始音频进行重采样。通过建立原始音频的内容分布到标准音频的内容分布的映射关系,为原始音频的重采样的采样点设置提供有效指导,可以过滤掉无效的音频内容,提高采样效率,同时,最大限度的保留了原始音频中的有效信息,便于后期进行文字转换工作。技术研发人员:李伟,陈明露受保护的技术使用者:中国农业银行股份有限公司技术研发日:技术公布日:2024/3/11本文地址:https://www.jishuxx.com/zhuanli/20240618/22172.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表