技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于处理说话者的语音的设备和方法与流程 > 正文

用于处理说话者的语音的设备和方法与流程

国知局
2024-06-21 11:49:30

本公开的实施方式涉及用于处理说话者的语音的设备和方法。

背景技术：

1、麦克风是用于识别语音并将语音转换为作为电信号的语音信号的设备。当麦克风设置在诸如会议室或教室的多个说话者所处的空间中时，麦克风接收来自多个说话者的所有语音，并生成与多个说话者的语音相关的语音信号。

2、当多个说话者同时讲话时，需要分离仅表示单独说话者的语音的语音信号。此外，当多个说话者以不同语言发音时，为了容易地翻译多个说话者的语音，应该识别多个说话者的语音的原始语言(即，源语言)，并且当通过仅使用语音的特征来识别相应语音的语言时，存在花费大量时间并且需要许多资源的问题。

技术实现思路

1、[技术问题]

2、本公开涉及提供一种语音处理设备和方法，其可以使用说话者的语音信号来识别说话者的位置，并且为每个说话者分离和识别语音信号。

3、本公开还涉及提供一种语音处理设备和方法，其可以从说话者的语音来确定每个说话者的位置，根据所确定的位置来确定每个说话者的当前语言，并且生成翻译结果，其中根据所确定的当前语言，每个说话者的语音的当前语言被翻译成不同的语言。

4、本公开还涉及提供一种语音处理设备和方法，其可以使用翻译结果生成翻译的会议记录，翻译的会议记录包括以不同语言来表示的每个说话者的语音内容，通过将每个说话者的语音的当前语言翻译成不同语言而获得翻译结果。

5、[解决问题的方案]

6、根据本公开的实施方式的语音处理设备被配置为生成说话者的语音的翻译结果，并且所述语音处理设备包括：麦克风，其被配置为响应于所述说话者的语音而生成与所述说话者的语音相关联的语音信号；存储器，其被配置为存储位置语言信息，所述位置语言信息表示与所述说话者的语音的声源位置相对应的语言；以及处理器，其被配置为生成翻译结果，并且使用所述翻译结果生成翻译的会议记录，所述翻译结果通过使用所述语音信号和所述位置语言信息来翻译每一个所述说话者的语音的语言而获得，所述翻译的会议记录包括以不同语言表示的每个所述说话者的语音内容。

7、[发明的有益效果]

8、根据本公开的实施方式的语音处理设备和方法，可以使用说话者的语音信号来识别说话者的位置，并且分离和识别每个说话者的语音信号。

9、根据本公开的实施方式的语音处理设备和方法，可以从说话者的语音来确定每个说话者的位置，根据所确定的位置来确定每个说话者的当前语言，并且根据所确定的当前语言来生成翻译结果，其中每个说话者的语音的当前语言被翻译成不同的语言。

10、根据本公开的实施方式的语音处理设备和方法，可以使用翻译结果生成翻译的会议记录，翻译的会议记录包括以不同语言来表示的每个说话者的语音内容的，通过将每个说话者的语音的当前语言翻译成不同语言而获得翻译结果。

技术特征：

1.一种语音处理设备，其特征在于，所述语音处理设备被配置为生成说话者的语音的翻译结果，所述语音处理设备包括：

2.根据权利要求1所述的语音处理设备，其特征在于，所述处理器被配置为：

3.根据权利要求1所述的语音处理设备，其特征在于，所述处理器被配置为：

4.根据权利要求2所述的语音处理设备，其特征在于，所述处理器被配置为：

5.根据权利要求4所述的语音处理设备，其特征在于，所述处理器被配置为：

6.根据权利要求2所述的语音处理设备，其特征在于，所述处理器使用所述分离语音信号生成原始会议记录，所述原始会议记录包括以所述说话者的语音的所述当前语言表示的每个所述说话者的语音内容。

7.根据权利要求1所述的语音处理设备，其特征在于，所述处理器生成所述翻译的会议记录，将所述翻译结果转换为文本，并且在所述翻译的会议记录中记录文本数据。

8.一种使用语音处理设备的语音处理方法，其特征在于，所述语音处理设备被配置为生成说话者的语音的翻译结果，所述语音处理方法包括：

9.根据权利要求8所述的语音处理方法，其特征在于，生成所述翻译结果包括：

10.根据权利要求9所述的语音处理方法，其特征在于，所述麦克风包括设置为形成阵列的多个麦克风，并且

11.根据权利要求9所述的语音处理方法，其特征在于，生成所述翻译结果还包括：

12.根据权利要求11所述的语音处理方法，其特征在于，生成所述翻译结果还包括：

13.根据权利要求9所述的语音处理方法，其特征在于，还包括使用所述分离语音信号生成原始会议记录，所述原始会议记录包括以所述说话者的语音的所述当前语言表示的每个所述说话者的语音内容。

14.根据权利要求8所述的语音处理方法，其特征在于，还包括将所述翻译结果转换成文本，并在所述翻译的会议记录中记录文本数据。

技术总结公开了一种语音处理设备，用于生成说话者的语音的翻译结果。语音处理设备包括麦克风，用于响应于说话者的语音生成与说话者的语音相关联的语音信号；存储器，用于存储位置语言信息，该位置语言信息表示与说话者的语音的声源位置对应的语言；以及处理器，其使用语音信号和位置语言信息以便生成通过翻译每个说话者的语音而获得的翻译结果，并使用翻译结果生成包括以不同语言表示的每个说话者的语音内容的翻译会议记录。技术研发人员：金正敏受保护的技术使用者：阿莫先恩电子电器有限公司技术研发日：技术公布日：2024/5/8