一种音频变调方法及显示设备与流程
- 国知局
- 2024-06-21 11:50:16
本发明涉及显示设备,尤其涉及一种音频变调方法及显示设备。
背景技术:
1、对音频进行变调处理能够提升显示设备的娱乐性,例如歌曲的音调对于用户来说太高或太低,都可以利用音频变调算法对歌曲进行降调或升调,以使歌曲的音调符合用户的实际音调需求。在显示设备上对音频进行变调输出的过程包括以下步骤:输入音频信号经过前处理后,进入变调处理,然后经过其他的信号处理,最后输出到功效,再由功放输出到音箱播放。其中输入音频信号可以是麦克风拾取的人声信号,也可以是歌曲的伴奏信号。
2、常用的变调方法包括基于深度学习的变调、wsola(waveform similarityoverlap-add,波形相似叠加)变调等变调方法。基于深度学习变调的方法,根据数据类型可以分为两种:第一种为平行数据,即源说话人和目标说话人有相同文本的语音数据,训练出一一对应的映射关系的模型。另一种是非平行数据,即只有源说话人和目标说话人不同的语音数据,训练出一到任意的映射关系的模型。实际应用中由于基于深度学习的变调方法需要比较大的计算量和存储空间,在采用资源比较少的soc(system on chip,芯片级系统)芯片或者dsp(digital signal processing,数字信号处理器)时经常无法使用基于深度学习的变调方法。
3、为了减少计算量和资源占用,通常采用wsola变调方法进行音频变调。wsola变调方法还可以缓解波形不连续(基音断裂)的问题。然而wsola变调方法虽然能够减轻波形的不连续,但是其无法从根本上解决波形不连续的问题,并且同时使用wsola变调方法进行变调处理会引入新的问题。例如,当输入信号包含有冲击瞬态信号时,使用wsola变调方法可能会导致合成音频失真。因此如何在系统资源减少时实现变调并且能够避免音频失真成为亟待解决的问题。
技术实现思路
1、本申请提供一种音频变调方法及显示设备,以解决相关音频变调方法无法在资源减少时既实现变调又能够避免音频失真的问题。
2、第一方面,本申请一些实施例提供一种显示设备,包括:
3、显示器;
4、扬声器,被配置为播放音频信号;
5、控制器,被配置为:
6、接收输入的原始音频信号和变调因子,其中,所述变调因子表征音调调节的级别;
7、根据所述变调因子生成基本延时参数和随机延时参数;
8、基于所述基本延时参数和所述随机延时参数生成至少两条延时线;
9、利用至少两条所述延时线对所述原始音频信号进行线性插值处理和幅度调制处理,得到至少两个处理后的音频信号;
10、对至少两个处理后的音频信号叠加处理后输出变调后的音频信号。
11、第二方面,本申请一些实施例提供一种音频变调方法,包括:
12、接收输入的原始音频信号和变调因子,其中,所述变调因子表征音调调节的级别;
13、根据所述变调因子生成基本延时参数和随机延时参数;
14、基于所述基本延时参数和所述随机延时参数生成至少两条延时线;
15、利用至少两条所述延时线对所述原始音频信号进行线性插值处理和幅度调制处理,得到至少两个处理后的音频信号;
16、对至少两个处理后的音频信号叠加处理后输出变调后的音频信号。
17、由以上技术方案可知,上述实施例及提供的音频变调方法及显示设备,控制器在接收到输入的原始音频信号和变调因子之后,根据变调因子生成基本延时参数和随机延时参数。然后基于基本延时参数和随机延时参数生成至少两条延时线。利用至少两条延时线对原始音频信号进行线性插值处理和幅度调制处理,得到至少两个处理后的音频信号。最后对至少两个处理后的音频信号叠加处理后输出变调后的音频信号。本申请实施例的音频变调方法采用延时线对原始音频信号进行线性插值处理和幅度调制处理,不需要检测共振峰减少计算量,同时由原始音频帧的前后帧进行叠加来实现变调解决帧间相位的不连续问题,然后采用幅度调制处理不会产生谐波从而避免声音失真,并且采用基本延时和随机延时相结合,减少数据处理过程中的存储空间从而减少系统资源占用。
技术特征:1.一种显示设备,其特征在于,包括:
2.根据权利要求1所述的显示设备,其特征在于,所述控制器在执行基于所述基本延时参数和所述随机延时参数生成至少两条延时线,利用至少两条所述延时线对所述原始音频信号进行线性插值处理和幅值调制处理,得到至少两个处理后的音频信号,被配置为:
3.根据权利要求2所述的显示设备,其特征在于,线性插值公式为:ti(n)=ci*x(ki+1)+(1-ci)*x(ki),其中,ci为加权系数,ki为下标参数,x(n)为所述音频信号的原始数据中的n点数据;
4.根据权利要求3所述的显示设备,其特征在于,利用所述基本延时参数和所述随机延时参数计算线性插值公式和幅值调制公式对应的下标参数的计算公式为:
5.根据权利要求4所述的显示设备,其特征在于,对至少两个处理后的音频信号叠加处理后输出变调后的音频信号的对应公式为:
6.根据权利要求1所述的显示设备,其特征在于,所述控制器在执行输出变调后的音频信号之前,还被配置为:将变调处理后的音频信号乘以预设增益。
7.根据权利要求1所述的显示设备,其特征在于,所述控制器在执行基于所述基本延时参数和所述随机延时参数生成至少两条延时线,利用至少两条所述延时线对所述原始音频信号进行线性插值处理和幅度调制处理,得到至少两个处理后的音频信号,对至少两个处理后的音频信号叠加处理后输出变调后的音频信号,被配置为:
8.根据权利要求1所述的显示设备,其特征在于,所述控制器在执行利用至少两条所述延时线对所述原始音频信号进行线性插值处理之后,还被配置为:
9.根据权利要求1所述的显示设备,其特征在于,如果所述控制器接收到的变调因子包括第一变调因子和第二变调因子,所述第一变调因子对应所述原始音频信号中的第一音频片段,所述第二变调因子对应所述音频信号中的第二音频片段,所述控制器,还被配置为:
10.一种音频变调方法,其特征在于,包括:
技术总结本申请提供一种音频变调方法及显示设备,根据变调因子生成基本延时参数和随机延时参数。然后基于基本延时参数和随机延时参数生成至少两条延时线。利用至少两条延时线对原始音频信号进行线性插值处理和幅度调制处理,得到至少两个处理后的音频信号。最后对至少两个处理后的音频信号叠加处理后输出变调后的音频信号。本申请实施例的音频变调方法采用延时线对原始音频信号进行线性插值处理和幅度调制处理,由原始音频帧的前后帧进行叠加来实现变调解决帧间相位的不连续问题,然后采用幅度调制处理不会产生谐波从而避免声音失真,并且采用基本延时和随机延时相结合,减少数据处理过程中的存储空间从而减少系统资源占用。技术研发人员:周鉴星,林子毅,陶廉洁,杨毅受保护的技术使用者:海信电子科技(深圳)有限公司技术研发日:技术公布日:2024/5/9本文地址:https://www.jishuxx.com/zhuanli/20240618/23877.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表