技术新讯 > 乐器声学设备的制造及制作,分析技术 > 具有波束形成功能的音频编解码装置、方法及系统与流程 > 正文

具有波束形成功能的音频编解码装置、方法及系统与流程

国知局
2024-06-21 11:43:41

本技术涉及音频编解码领域，特别是涉及一种具有波束形成功能的音频编解码装置、方法及系统。

背景技术：

1、音频编解码系统是通信和媒体领域的核心技术，其主要功能是对音频信号进行编码和解码，以便在不同设备和平台之间有效传输和存储。音频编解码系统通过压缩音频文件，减少存储空间和传输带宽需求，同时保持原始音频质量，其广泛应用在手机通信、在线音乐流媒体和电影制作领域。随着技术进步，音频编解码系统和信号处理技术的结合成为大趋势，提升了编解码效率和质量，使其能更智能地处理复杂的音频信号。这种结合促进了新的应用和创新，如3d音频渲染和个性化音频体验，为音频技术的未来发展打开了新的可能性。因此，音频编解码系统和信号处理技术的融合是推动行业发展、满足用户需求的关键。

2、麦克风波束形成技术是一种高级的信号处理方法，其通过多个麦克风的阵列来定向地捕捉声音。这种技术通过调整每个麦克风信号的相位和幅度，使得来自特定方向的声音信号得到增强，而其他方向的噪声和干扰则被有效抑制。麦克风波束形成技术广泛地应用于会议系统、智能音箱、助听设备和噪声抑制系统等领域。这项技术的重要性在于它能显著提升音频捕捉的质量，特别是在多噪声环境或远场音频捕捉场景中。例如，在会议室环境中，麦克风波束形成可以帮助更清晰地捕捉说话者的声音，同时减少背景噪音的干扰。

3、现有的麦克风波束形成技术存在的问题包括入门门槛高、高度依赖阵列构型以及对算力的需求较大的问题。首先常规的音频设备通常不包含波束形成功能，波束形成功能高度依赖于专业人员从而提升了产品开发的成本。其次，麦克风波束形成取决于麦克风阵列的布局和数量，不同的应用场景对应着多种不同的阵列，这导致一旦更改使用环境或目的，可能需要对麦克风阵列进行重新设计和配置。最后，麦克风波束形成需要较高的计算资源对多个麦克风收集的信号进行实时分析处理，对算力要求较高，从而导致产品研发提高。

技术实现思路

1、鉴于以上所述现有技术的缺点，本技术的目的在于提供具有波束形成功能的音频编解码装置、方法及系统，用于解决现有技术的麦克风波束形成技术中存在的入门门槛高、高度依赖阵列构型以及对算力的需求较大的问题。

2、为实现上述目的及其他相关目的，本技术的第一方面提供一种具有波束形成功能的音频编解码装置，包括：信号采集单元，用于通过一对或多对音频采集设备采集近端音频模拟信号；每个音频采集设备采集其中一路近端音频模拟信号；模数转换单元，与所述信号采集单元电性连接；所述模数转换单元用于对所述近端音频模拟信号执行模数转换操作、数据匹配操作以及数据缓存操作，以生成对应的近端音频数字信号，并将所述近端音频数字信号输出至波束处理单元；波束处理单元，与所述模数转换单元电性连接；所述波束处理单元包括两个输入端和一个输出端，两个输入端分别输入近端音频数字信号，以及由控制接口发送的所述音频采集设备的位置信息；波束处理单元通过近端音频数字信号和音频采集设备的位置信息生成波束信号，并将所述波束信号通过输出端输出至音频接口。

3、于本技术的第一方面的一些实施例中，所述波束处理单元包括：傅里叶变换模块：其中包括一个输入端和一个输出端；输入端与所述模数转换单元相连，输出端与声源方向估计模块相连；所述傅里叶变换模块将接收到的近端音频数字信号从时域转换至频域，以生成近端音频数字信号的频域信号，并将所述近端音频数字信号的频域信号发送至声源方向估计模块；声源方向估计模块：其中包括两个输入端和一个输出端；输入端与所述傅里叶变换模块和控制接口相连，输出端与波束形成模块相连；所述声源方向估计模块基于音频采集设备的位置信息和近端音频数字信号的频域信号执行声源定向操作，以生成声源定向信息；并将近端音频数字信号的频域信号和所述声源定向信息发送至波束形成模块；波束形成模块：其中包括两个输入端和一个输出端；两个输入端分别与所述声源方向估计模块和控制接口相连，输出端与傅里叶逆变换模块相连；所述波束形成模块基于音频采集设备的位置信息、声源定向信息、近端音频数字信号的频域信号执行波束形成操作，以生成波束中间信号，并将所述波束中间信号发送至傅里叶逆变换模块；傅里叶逆变换模块：其中包括一个输入端和一个输出端；输入端与所述波束形成模块相连，输出端与音频接口相连；所述傅里叶逆变换模块将接收到的波束中间信号从频域转换至时域，以生成波束信号，并将所述波束信号发送至音频接口。

4、于本技术的第一方面的一些实施例中，所述声源方向估计模块执行声源定向操作的过程包括：接收由所述傅里叶变换模块发送的近端音频数字信号的频域信号，以及由控制接口发送的所述音频采集设备的位置信息；基于音频采集设备的位置信息，计算声源定向延迟和音频采集设备的最大距离；基于所述声源定向延迟和最大距离，计算声源方向角度作为声源定向信息，并将所述声源定向信息发送至波束形成模块。

5、于本技术的第一方面的一些实施例中，计算声源定向延迟和音频采集设备的最大距离的过程包括：基于音频采集设备的位置信息，选择距离最远的一对音频采集设备所采集的对应的频域信号作为声源参考信号，并计算当前对音频采集设备之间的位置距离差作为所述最大距离；构建所述声源参考信号的互相关函数，并基于所述互相关函数计算所述声源参考信号之间的声源定向延迟。

6、于本技术的第一方面的一些实施例中，所述波束形成模块执行波束形成操作的过程包括：接收由所述声源方向估计模块发送的近端音频数字信号的频域信号和声源定向信息，以及由控制接口发送的所述音频采集设备的位置信息；基于音频采集设备的位置信息，计算近端音频数字信号的波束形成系数；基于所述束形成系数，通过所述近端音频数字信号的频域信号生成波束信号。

7、于本技术的第一方面的一些实施例中，计算近端音频数字信号计算波束形成系数的过程包括：基于音频采集设备的位置信息，计算声波到达延迟，根据所述声波到达延迟，计算每个音频采集设备的声波到达矢量；基于近端音频数字信号的频域信号，计算近端音频数字信号的协方差矩阵；基于所述协方差矩阵和所述声波到达矢量，计算近端音频数字信号的波束形成系数。

8、于本技术的第一方面的一些实施例中，模数转换单元包括：模数转换模块：用于对近端音频信号的模拟信号执行模数转换操作，以生成模数中间信号；数据匹配模块：用于对所述模数转换模块输出的所述模数中间信号进行格式转换匹配操作，以生成近端音频信号的数字信号；数据缓存模块：用于对近端音频信号的数字信号执行延时匹配及数据缓存操作。

9、为实现上述目的及其他相关目的，本技术的第二方面提供一种具有波束形成功能的音频编解码方法，应用于音频编解码器，包括：通过一对或多对音频采集设备采集近端音频模拟信号；每个音频采集设备采集其中一路近端音频模拟信号；对所述近端音频模拟信号执行模数转换操作、数据匹配操作以及数据缓存操作，以生成对应的近端音频数字信号；接收所述音频采集设备的位置信息，通过近端音频数字信号和音频采集设备的位置信息生成波束信号，并将所述波束信号输出至音频接口。

10、于本技术的第二方面的一些实施例中，通过近端音频数字信号和音频采集设备的位置信息生成波束信号的过程包括：将接收到的近端音频数字信号从时域转换至频域以生成近端音频数字信号的频域信号；基于音频采集设备的位置信息和近端音频数字信号的频域信号执行声源定向操作，以生成声源定向信息；基于音频采集设备的位置信息和所述声源定向信息，对所述近端音频数字信号的频域信号执行波束形成操作，以生成波束中间信号；将波束中间信号从频域转换至时域，以生成波束信号。

11、为实现上述目的及其他相关目的，本技术的第三方面提供一种具有波束形成功能的音频编解码系统，包括：主处理器以及如上述的具有声源定向功能的音频编解码装置。

12、如上所述，本技术的音频编解码领域，特别是涉及一种具有波束形成功能的音频编解码装置、方法及系统，具有以下有益效果：本发明通过将波束形成功能集成于音频编解码器中的方式，大幅简化了麦克风波束形成技术的使用流程，用户仅需输入麦克风的相对位置，音频编解码器即可自动地进行波束形成处理；同时基于麦克风相对位置还可自动地对参数配置进行计算，从而使得系统能够适应多种麦克风阵列布局，摆脱了波束形成技术对麦克风阵列构型依赖性较强的问题；此外具有波形成功能的编解码器还缓解了现有技术中对算力的需求，显著减轻了主处理器的计算负担，降低了产品的整体成本并简化了设计和生产的流程。