技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种音频测试分析方法与流程  >  正文

一种音频测试分析方法与流程

  • 国知局
  • 2024-06-21 11:38:34

本发明涉及音频测试,具体而言,是一种音频测试分析方法。

背景技术:

1、随着信息技术的不断发展,音频在我们的日常生活中扮演着越来越重要的角色,包括音乐、电影、广播、电话通话等等,为了确保音频质量的准确性和可靠性,音频测试成为必不可少的工具,在过去,人们主要依靠主观的听觉分析来评估音频质量,然而,这种主观评估容易受到个体差异、主观偏好和环境影响等因素的干扰,导致评估结果的不一致和不准确,为了克服这些问题,客观的音频测试方法得以发展和应用。

2、音频测试是指对音频信号进行各种形式的测试和分析,以评估其质量、性能和特征的过程,目前,音频测试技术已经得到了广泛的应用,涵盖了音乐产业、电视广播、电影制作、通信领域等多个领域,从音频设备的制造商到内容提供商,都需要进行音频测试以确保他们的产品和服务在音质方面达到用户的要求。

3、专利名称为一种音频质量评测方法及系统(专利号为201510091491.x)的中国专利公布的技术方案,该方案通过接收音频数据,对音频数据进行转码处理,并计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率等特征,进而计算音频质量得分,综合了多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需要,但仍存在一些不足之处:一、该方案虽然考虑了音频的一些基础参数,但音频质量还受到其他因素影响,比如失真程度,忽略失真程度将使得评价过程中无法捕捉传输和处理环节中产生的变形,会极大影响音频质量,导致音频质量的全面性评估受到限制,进而无法全面展现音频设备或内容的真实表现。

4、二、该方案综合了多项音频质量参数对音频质量进行评测,但音频质量的评价不能仅仅局限于音频本身的基础参数,也需要考虑到其在实际应用中的表现,比如语音识别的准确性,将语音识别的准确性纳入考量是至关重要的,如果音频无法被准确地转录或理解,即使音频质量看似良好,但其实际实用性也大打折扣。

技术实现思路

1、为了克服背景技术中的缺点,本发明实施例提供了一种音频测试分析方法,能够有效解决上述背景技术中涉及的问题。

2、本发明的目的可以通过以下技术方案来实现:一种音频测试分析方法,该方法包括以下步骤:s1.音频基础参数采集:采集音频文件并将其转换为波形图谱,进而从音频的波形图谱中读取音频基础参数,音频基础参数包括最大频率、各频率段幅度、波峰波动幅度、波谷波动幅度、信号动态差值。

3、s2.音频基础参数质量分析:根据音频的音频基础参数分析得到音频的质量系数。

4、s3.信噪比分析:对音频的平均功率、噪声音频的平均功率进行检测,分析得到音频的信噪比s。

5、s4.音频失真数据采集:对削波失真的时长占比、音频频率段的平均幅度偏差、主频率的谐波总和进行检测。

6、s5.音频失真数据分析:根据削波失真的时长占比、音频频率段的平均幅度偏差、主频率的谐波总和分析音频的失真程度。

7、s6.音频标准性分析:将音频通过语音识别转换为文字,并将识别出来的文字同音频原始文本进行比较,分析得到音频识别的标准程度。

8、s7.音频设备质量分析:根据音频的质量系数ψ、音频的信噪比s、音频的失真程度ξ、音频识别的标准程度χ得到音频综合质量指数,进而分析得到对应音频设备的质量指数,同时将其同预设的质量指数阈值进行比对得到对应音频设备的质量情况。

9、优选的,所述音频基础参数采集的具体分析过程如下:第一步,对音频设备输出的音频进行采集,将采集到的音频输入到频谱分析工具中转换为波形图谱,记为音频波形图谱,同时从管理数据库中提取音频的原始文件,将其转换为波形图谱,记为音频原始波形图谱。

10、第二步,从音频波形图谱中读取音频的采样率,将其记为fs,进而得到音频的最大频率同时以设定频率点划分频率段,记为各频率段,读取音频波形图谱中音频在各频率段的幅度,记为各频率段幅度fk,其中k表示第k个频率段的编号,k=1,2,...,f。

11、第三步,将各频率段幅度同其上一频率段幅度进行比对,若该频率段幅度大于其上一频率段幅度,则将该频率段幅度记为峰段周期,若该频率段幅度小于其上一频率段幅度,则将该频率段幅度记为谷段周期,统计峰段周期和谷段周期的数量,将各峰段周期和各谷段周期的幅度分别记为fi、fm,其中i表示第i个峰段周期的编号,i=1,2,...,n,m表示第m个谷段周期的编号,m=1,2,...,q,通过对各峰段周期和各谷段周期的幅度求取平均值得到峰段周期、谷段周期的平均幅度,分别记为同时从各峰段周期幅度中筛选出最大幅度,从各谷段周期幅度中筛选出最小幅度,分别记为最大幅度fmax、最小幅度fmin,将其代入到公式得到波峰波动幅度δf峰,波谷波动幅度δf峰。

12、第四步,将最大幅度fmax、最小幅度fmin代入到公式得到信号动态差值d。

13、优选的,所述音频基础参数质量分析的具体分析过程如下:第一步,读取原始波形图谱,按照从音频的波形图谱中分析音频基础参数的方法,从音频原始波形图谱中分析得到音频的原始音频数据,原始音频数据包括原始最大频率fs0、各频率段原始幅度fk0、原始波峰波动幅度δf峰0、原始波谷波动幅度δf谷0、原始信号动态差值d0。

14、第二步,读取音频的音频基础参数,将其代入到公式得到音频的质量系数ψ,其中φ1、φ2、φ3、φ4、φ5分别表示最大频率、频率段幅度、波峰波动幅度、波谷波动幅度、信号动态差值的权值因子,且φ1+φ2+φ3+φ4+φ5=1,e表示自然常数,f表示频率段的数量。

15、优选的,所述信噪比分析的具体分析过程如下:第一步,对音频设备输出的音频进行采集,并按照设定采样点对采集到的音频进行采样,记为各采样点音频,读取音频的波形图谱,从中得到各采样点的幅度,记为au,其中u表示第u个采样点的编号,u=1,2,...,v,将其代入到公式得到音频的平均功率p,v表示采样点的数量。

16、第二步,从音频中截取音频设备处于打开状态但没有实际音频输出的音频段,记为噪声音频,按照设定噪声采样点对噪声音频进行采样,记为各噪声采样点音频,从音频的波形图谱中得到各噪声采样点的幅度,记为aa,其中a表示第a个噪声采样点的编号,a=1,2,...,b,通过公式得到噪声音频的平均功率p噪声,其中b表示噪声采样点的数量。

17、第三步,将音频的平均功率p、噪声音频的平均功率p噪声代入到公式得到音频的信噪比s。

18、优选的,所述音频失真数据采集的具体分析过程如下:第一步,读取各频率段幅度,将其和预设的波形幅度阈值进行比对,若某频率段幅度大于预设的波形幅度阈值,则将该频率段记为削波失真频率段,统计削波失真频率段的数量,读取各频率段的时长,筛选各削波失真频率段的时长,将各削波失真频率段的时长相加得到音频的失真时长,通过用音频的失真时长除以音频的总时长得到削波失真的时长占比,记为α。

19、第二步,分别读取各频率段幅度和各频率段原始幅度,通过对各频率段幅度和各频率段原始幅度作差得到各频率段幅度差,记为δfk,将各频率段幅度差代入到公式得到音频频率段的平均幅度偏差m,其中f表示频率段的数量。

20、第三步,对音频设备输出的音频进行信号采集,通过傅里叶变换算法将音频信号从时域转换到频域得到音频信号的频谱图,记为音频频谱图,读取音频频谱图中各频率点的振幅,从各频率点的振幅中筛选出振幅最大值,将振幅最大值对应的频率点记为主频率点,读取主频率点的频率并从音频频谱图中筛选出主频率点的整数倍频率点,记为各整数倍频率点,读取各整数倍频率点的振幅,通过对各整数倍频率点的振幅求和得到主频率的谐波总和,将其记为β。

21、优选的,所述音频失真数据分析的具体分析方法为:分别读取削波失真的时长占比α、音频频率段的平均幅度偏差m、主频率的谐波总和β,将其代入到公式得到音频的失真程度ξ,其中α0、m0、s0分别表示设定的削波失真的时长占比、音频频率段的平均失真程度、主频率的谐波总和的最大允许值,μ1、μ2、μ3分别表示削波失真的时长占比、音频频率段的平均失真程度、主频率的谐波总和的权值因子,e表示自然常数。

22、优选的,所述音频标准性分析的具体分析方法为:对音频设备输出的音频进行采集并导入语音识别软件,将音频中的语音自动转换为文本,记为音频转换文本,从管理数据库中读取音频原始文本,将音频转换文本同音频原始文本进行逐字比对,筛选出音频原始文本中与音频转换文本不对应的文字数量,记为ε,将其代入到公式得到音频识别的标准程度χ,其中ε总表示设定的音频原始文本的总字数。

23、优选的,所述音频设备质量分析的具体分析过程如下:第一步,分别读取音频的质量系数ψ、音频的信噪比s、音频的失真程度ξ、音频识别的标准程度χ,将其代入到公式

24、得到音频综合质量指数其中s0、χ0分别表示预设的音频的信噪比、音频识别的标准程度的参考值,ξ允许表示预设的音频的失真程度的最大允许值,w1、w2、w3、w4分别表示设定的音频的质量系数、音频的信噪比、音频的失真程度、音频识别的标准程度的权值因子,且w1+w2+w3+w4=1,e表示自然常数。

25、第二步,通过将音频综合质量指数代入到公式得到对应音频设备的质量指数其中e表示自然常数,将对应音频设备的质量指数同预设的质量指数阈值进行比对,若对应音频设备的质量指数小于预设的质量指数阈值,则表示对应音频设备质量较差,将对应音频设备的质量情况进行反馈。

26、相对于现有技术,本发明的实施例至少具有如下优点或有益效果:一、本发明通过对音频的最大频率、各频率段幅度、波峰波动幅度、波谷波动幅度、信号动态差值分析得到音频的质量系数,可以对音频进行客观的量化评价,有助于判断音频的清晰度、音质和真实度,从而提供更好的音频体验。

27、二、本发明通过对音频的平均功率、噪声音频的平均功率进行检测,分析得到音频的信噪比,更全面地了解了音频信号的特点,便于有效改善音频的质量,提高声音的清晰度和纯净度,获得更为一致和高质量的音频输出。

28、三、本发明根据削波失真的时长占比、音频频率段的平均幅度偏差、主频率的谐波总和分析音频的失真程度,可以更准确地评估音频的质量,从而进一步确定音频中存在的问题,并采取相应的修复措施,提高音频的质量。

29、四、本发明通过将音频通过语音识别转换为文字,并同音频原始文本进行比较,分析得到音频识别的标准程度,方便评估音频的清晰度,辅助音频质量改进,有助于提高音频的质量和准确性,进而提升语音识别等相关应用的性能和效果。

30、五、本发明通过音频的质量系数、音频的信噪比、音频的失真程度、音频识别的标准程度得到音频综合质量指数,进而分析得到对应音频设备的质量指数,从而指导音频质量改进,提供比较和选择的基准,对音频相关的应用和服务具有重要作用,有助于提高用户体验和应用功能的可用性。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22622.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。