技术新讯 > 电子通信装置的制造及其应用技术 > 声音信号处理装置、声音信号处理方法以及声音信号处理程序与流程 > 正文

声音信号处理装置、声音信号处理方法以及声音信号处理程序与流程

国知局
2024-09-14 14:22:44

本公开涉及对由麦克风阵列取得的声音信号进行处理的技术。

背景技术：

1、过去，存在利用了麦克风和扬声器的扩音型的双方向通话系统。在这样的扩音型的双方向通话系统中，使用抑制音响回波的回波消除器。

2、在扩音型的双方向通话系统中，由于近端说话人和远端说话人同时发声，相互的声音重叠，有可能产生被称作双讲(double talk)的现象。在近端说话人的声音和从扬声器输出的远端说话人的声音同时输入麦克风的情况下，有可能产生残留回波，或者声音中断。

3、因此，例如，专利文献1所示的免提通话装置用摄像机对用户的脸的部分进行摄像，从摄像机所摄像的图像数据检测用户的嘴的活动，通过调整放大率来调整从用户向通话对方发送的发送声音信号的信号电平，在未检测到嘴的活动的情况下，将放大率设定为小于1的值，在检测到嘴的活动的情况下，将发送声音信号的放大率设为1以上的值。

4、但在上述现有的技术中，有可能不能抑制音响回波，需要进一步的改善。

5、现有技术文献

6、专利文献

7、专利文献1：jp特开2014-110554号公报

技术实现思路

1、本公开为了解决上述的问题而做出，目的在于，提供能确实地抑制音响回波的技术。

2、本公开所涉及的声音信号处理装置具备：图像取得部，取得由摄像机摄像的图像；说话人检测部，检测所述图像中包含的近端说话人；说话人方向确定部，确定检测到的所述近端说话人所在的方向；声音取得部，取得由具有多个麦克风的麦克风阵列拾取的声音信号；声音到来方向检测部，基于所述声音信号来检测声音的到来方向；发声推定部，基于所述近端说话人所在的方向和所述声音的到来方向，来推定所述近端说话人是否正在发声；电平调整部，在推定为所述近端说话人正在发声的情况下，将所述声音信号的放大率设定为1以上的值，在推定为所述近端说话人未在发声的情况下，将所述声音信号的放大率设定为小于1的值，基于所设定的所述放大率来调整所述声音信号的电平；和输出部，将调整过的所述声音信号作为向远端说话人发送的送话信号而输出。

3、根据本公开，能确实地抑制音响回波。

技术特征：

1.一种声音信号处理装置，具备：

2.根据权利要求1所述的声音信号处理装置，其中，

3.根据权利要求2所述的声音信号处理装置，其中，

4.根据权利要求3所述的声音信号处理装置，其中，

5.根据权利要求3所述的声音信号处理装置，其中，

6.根据权利要求1～5中任一项所述的声音信号处理装置，其中，

7.根据权利要求6所述的声音信号处理装置，其中，

8.根据权利要求1～5中任一项所述的声音信号处理装置，其中，

9.一种声音信号处理方法，在该声音信号处理方法中，由计算机执行如下处理：

10.一种声音信号处理程序，使计算机作为如下要素发挥功能：

技术总结声音信号处理装置(1)具备：说话人检测部(102)，检测由摄像机(2)摄像的图像中包含的近端说话人；说话人方向确定部(103)，确定近端说话人所在的方向；声音到来方向检测部(105)，基于由麦克风阵列(3)拾取的声音信号来检测声音的到来方向；发声推定部(106)，基于近端说话人所在的方向和声音的到来方向来推定近端说话人是否正在发声；回波抑制器(107)，在推定为近端说话人正在发声的情况下，将声音信号的放大率设定为1以上的值，在推定为近端说话人未在发声的情况下，将声音信号的放大率设定为小于1的值，基于所设定的放大率来调整声音信号的电平；和声音输出部(109)，将调整过的声音信号作为向远端说话人发送的送话信号而输出。技术研发人员：广濑良文受保护的技术使用者：松下电器（美国）知识产权公司技术研发日：技术公布日：2024/9/12