技术新讯 > 电子通信装置的制造及其应用技术 > 语音处理系统、语音处理方法、介质、产品及设备与流程 > 正文

语音处理系统、语音处理方法、介质、产品及设备与流程

国知局
2024-08-22 14:23:00

本公开涉及多媒体，尤其涉及一种语音处理系统、语音处理方法、介质、产品及设备。

背景技术：

1、相关技术中，在通话、会议、导航、视频播放、广场活动等使用扬声器播放声音的情景下，部分人员期望接收到较大的播放声音，但这些声音可能对其余人员产生较大的干扰。

技术实现思路

1、为克服相关技术中存在的问题，本公开提供一种语音处理系统、语音处理方法、介质、产品及设备。

2、根据本公开实施例的第一方面，提供一种语音处理系统，所述语音处理系统包括：

3、语音接收模块，包括方位确定模块和麦克风阵列，所述麦克风阵列被配置为获取目标空间内的语音信号，所述方位确定模块被配置为根据所述语音信号，确定所述语音信号对应的声源的声源方位；

4、声音播放模块，包括波束调整模块和用于播放待播放声音信号的扬声器阵列，所述波束调整模块被配置为根据所述声源方位，确定所述扬声器阵列指向所述声源方位的聚向波束，以通过所述聚向波束向所述声源方位播放所述待播放声音信号，所述待播放声音信号是与所述声源进行语音交互的对象发送的。

5、可选地，所述波束调整模块，还被配置为根据所述声源方位，基于等旁瓣波束形成确定指向所述声源方位的聚向波束，以使所述扬声器阵列的功率辐射图的主瓣指向所述声源方位，且除所述声源方位外的其他声源方位对应的旁瓣信号凹陷。

6、可选地，所述方位确定模块还被配置为，根据所述语音信号的声源方位，确定所述麦克风阵列指向所述声源方位的拾音波束，以通过所述拾音波束拾取所述声源方位对应的语音信号。

7、可选地，在所述目标空间的声源为多个的情况下，所述语音处理系统还包括：

8、声源分离模块，被配置为根据多个声源中每一声源的声源方位，确定指向所述每一声源方位的拾音波束，并从所述多个声源中确定当前产生声音信号的目标声源；

9、所述语音接收模块，还被配置为确定指向所述目标声源所对应的声源方位的目标拾音波束，以通过所述目标拾音波束拾取所述目标声源的语音信号。

10、可选地，针对每一声源的拾音波束，所述拾音波束的主瓣信号覆盖所述声源所处声源方位，所述拾音波束中、除所述声源外的其余声源所对应声源方位的旁瓣信号被抑制。

11、可选地，所述方位确定模块，还被配置为通过所述目标空间内的多个音区的激活状态，确定所述多个音区中被激活的至少一个音区位置，并根据所述语音信号进行方位估计，以确定在所述至少一个音区位置内所述语音信号对应的声源的声源方位。

12、可选地，所述语音接收模块还包括以下至少一个模块：

13、回声消除模块，被配置为对所述麦克风阵列所拾取的语音信号进行回声消除处理；

14、非线性后处理模块，被配置为处理所述回声消除模块所处理后的语音信号进行非线性后处理；

15、声纹增强模块，被配置为根据所述声源的声纹信息对所述语音信号进行声纹增强处理和语音降噪处理；

16、噪声抑制模块，被配置为对所述语音信号进行噪声抑制处理；

17、自动增益模块，被配置为对所述语音信号进行自动增益处理，以使所述语音信号的增益在第一预设区间内；

18、均衡模块，被配置为对所述语音信号进行信号均衡处理。

19、可选地，所述声音播放模块还包括以下至少一个模块：

20、噪声抑制模块，被配置为对所述待播放声音信号进行噪声抑制处理；

21、自动增益模块，被配置为对所述待播放声音信号进行自动增益处理，以使所述待播放声音信号的增益在第二预设区间内；

22、均衡模块，被配置为对所述待播放声音信号进行信号均衡处理。

23、可选地，所述目标空间为车辆座舱内。

24、根据本公开实施例的第二方面，提供一种语音处理方法，包括：

25、获取目标空间内的语音信号，并根据所述语音信号，确定在所述目标空间内的所述语音信号对应的声源的声源方位；

26、根据所述声源方位确定指向所述声源方位的聚向波束，以通过所述聚向波束向所述声源方位播放待播放声音信号，所述待播放声音信号是与所述声源进行语音交互的对象所发送的。

27、根据本公开实施例的第三方面，提供一种非临时性计算机可读存储介质，其上存储有计算机程序指令，该程序指令被处理器执行时实现本公开第二方面提供的语音处理方法。

28、根据本公开实施例的第四方面，提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现本公开第二方面提供的语音处理方法。

29、根据本公开实施例的第五方面，提供一种多媒体设备，包括本公开第一方面提供的语音处理系统。

30、本公开的实施例提供的技术方案可以包括以下有益效果：

31、本公开的语音处理系统中，通过设置语音接收模块确定产生语音信号的声源的声源方位，并通过波束调整模块根据声源方位，确定扬声器阵列指向声源方位的聚向波束，以通过聚向波束向声源方位播放待播放声音信号。这样，可以根据有接收声音数据需求的声源的声源方位，能够控制扬声器阵列的聚向波束指向声源方位，实现定向向部分人员传播声音，从而减小了对其他人员的干扰程度。

32、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

技术特征：

1.一种语音处理系统，其特征在于，所述语音处理系统包括：

2.根据权利要求1所述的语音处理系统，其特征在于，

3.根据权利要求1所述的语音处理系统，其特征在于，所述方位确定模块还被配置为，根据所述语音信号的声源方位，确定所述麦克风阵列指向所述声源方位的拾音波束，以通过所述拾音波束拾取所述声源方位对应的语音信号。

4.根据权利要求3所述的语音处理系统，其特征在于，在所述目标空间的声源为多个的情况下，所述语音处理系统还包括：

5.根据权利要求3所述的语音处理系统，其特征在于，针对每一声源的拾音波束，所述拾音波束的主瓣信号覆盖所述声源所处声源方位，所述拾音波束中、除所述声源外的其余声源所对应声源方位的旁瓣信号被抑制。

6.根据权利要求1所述的语音处理系统，其特征在于，

7.根据权利要求1-6任一所述的语音处理系统，其特征在于，所述语音接收模块还包括以下至少一个模块：

8.根据权利要求1-6任一所述的语音处理系统，其特征在于，所述声音播放模块还包括以下至少一个模块：

9.根据权利要求1-6任一所述的语音处理系统，其特征在于，所述目标空间为车辆座舱内。

10.一种语音处理方法，其特征在于，包括：

11.一种非临时性计算机可读存储介质，其上存储有计算机程序指令，其特征在于，该程序指令被处理器执行时实现权利要求10所述的语音处理方法。

12.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求10所述的语音处理方法。

13.一种多媒体设备，其特征在于，包括权利要求1-10任一所述的语音处理系统。

技术总结本公开提供一种语音处理系统、语音处理方法、介质、产品及设备，涉及多媒体技术领域，系统包括：语音接收模块，包括方位确定模块和麦克风阵列，方位确定模块被配置为根据语音信号，确定语音信号对应的声源的声源方位；声音播放模块，包括波束调整模块和扬声器阵列，波束调整模块被配置为根据声源方位，确定扬声器阵列指向声源方位的聚向波束，以通过聚向波束向声源方位播放待播放声音信号，待播放声音信号是与声源进行语音交互的对象发送的。本公开可以根据有接收声音数据需求的声源的声源方位，控制扬声器阵列的聚向波束指向声源方位，实现定向传播声音，减小了对处于相同空间的其余人员的干扰程度。技术研发人员：宋其岩受保护的技术使用者：小米汽车科技有限公司技术研发日：技术公布日：2024/8/20