技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音识别方法、装置及电子设备与流程 > 正文

语音识别方法、装置及电子设备与流程

国知局
2024-06-21 11:51:25

本公开实施例涉及语音处理，尤其涉及一种语音识别方法、装置及电子设备。

背景技术：

1、语音识别技术可以将语音信息转换为文本信息。例如，电子设备可以通过自动语音识别技术将一段语音转换为文本，并显示该语音对应的文本。

2、目前，在进行语音识别时，可以在语音识别模型中添加一个语言模型，该语言模型可以预测当前语音相关联的文本对应的下一段文本，通过语言模型可以辅助语音识别模型对下一段语音进行识别。但是，语音识别模型和语言模型的训练样本中的长尾词(即，使用频率较低的词)较少，使得语音识别模型和语言模型对长尾词的识别准确率较低，导致语音识别的准确度较低。

技术实现思路

1、本公开提供一种语音识别方法、装置及电子设备，用于解决现有技术中语音识别的准确度较低的技术问题。

2、第一方面，本公开提供一种语音识别方法，该语音识别方法包括：

3、获取第一语音；

4、获取所述第一语音的上一段语音对应的第一文本；

5、获取第一集合，所述第一集合包括多个文本标识以及与所述多个文本标识中的每个文本标识对应的文本特征，所述文本特征为所述文本标识对应的文本的多种后续文本相关联的特征，所述文本特征与所述文本的多种后续文本在文本集合内的频次相关联，所述第一集合是基于所述文本集合确定得到的；

6、基于所述第一文本和所述第一集合，确定所述第一语音相关联的文本内容。

7、第二方面，本公开提供一种语音识别装置，包括第一获取模块、第二获取模块、第三获取模块和确定模块，其中：

8、所述第一获取模块用于，获取第一语音；

9、所述第二获取模块用于，获取所述第一语音的上一段语音对应的第一文本；

10、所述第三获取模块用于，获取第一集合，所述第一集合包括多个文本标识以及与所述多个文本标识中的每个文本标识对应的文本特征，所述文本特征为所述文本标识对应的文本的多种后续文本相关联的特征，所述文本特征与所述文本的多种后续文本在文本集合内的频次相关联，所述第一集合是基于所述文本集合确定得到的；

11、所述确定模块用于，基于所述第一文本和所述第一集合，确定所述第一语音相关联的文本内容。

12、第三方面，本公开实施例提供一种电子设备包括：处理器和存储器；

13、所述存储器存储计算机执行指令；

14、所述处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如上第一方面以及第一方面各种可能涉及的所述语音识别方法。

15、第四方面，本公开实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上第一方面以及第一方面各种可能涉及的所述语音识别方法。

16、第五方面，本公开实施例提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上第一方面以及第一方面各种可能涉及的所述语音识别方法。

17、本公开提供一种语音识别方法、装置及电子设备，电子设备可以获取第一语音，并获取第一语音的上一段语音对应的第一文本，电子设备可以获取第一集合，其中，第一集合包括多个文本标识以及与多个文本标识中的每个文本标识对应的文本特征，文本特征为文本标识对应的文本的多种后续文本相关联的特征，文本特征与文本的多种后续文本在文本集合内的频次相关联，第一集合是基于所述文本集合确定得到的，基于第一文本和第一集合，确定第一语音相关联的文本内容。在上述方法中，由于第一集合中的文本特征与文本的多种后续文本在文本集合内的频次相关联，因此，第一集合中的文本特征可以融合更多低频词的特征，电子设备可以通过第一集合得到更多的上下文信息，进而准确的对第一语音进行识别，提高语音识别的准确度。

技术特征：

1.一种语音识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一文本和所述第一集合，确定所述第一语音相关联的文本内容，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一文本和第一集合，确定所述第一文本的下一段第二文本，包括：

4.根据权利要求3所述的方法，其特征在于，基于所述第一标识，在所述第一集合中获取所述第一文本的多种后续文本相关联的第一文本特征，包括：

5.根据权利要求3所述的方法，其特征在于，基于所述第一文本和所述第一文本特征，确定所述第二文本，包括：

6.根据权利要求5所述的方法，其特征在于，基于所述上下文特征和所述第一文本特征，确定所述第二文本，包括：

7.根据权利要求2-6任一项所述的方法，其特征在于，所述基于所述第二文本和所述第一语音，确定所述第一语音相关联的文本内容，包括：

8.根据权利要求1-6任一项所述的方法，其特征在于，获取第一集合，包括：

9.根据权利要求8所述的方法，其特征在于，针对于所述多个样本文本中的任意一个第一样本文本；基于所述第一样本文本，对所述初始集合中的多个样本文本特征进行更新，包括：

10.根据权利要求9所述的方法，其特征在于，基于所述第一频次和所述后续文本特征，对所述第一样本文本特征进行更新，包括：

11.一种语音识别装置，其特征在于，包括第一获取模块、第二获取模块、第三获取模块和确定模块，其中：

12.一种电子设备，其特征在于，包括：处理器和存储器；

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1-10任一项所述的语音识别方法。

技术总结本公开提供一种语音识别方法、装置及电子设备，该方法包括：获取第一语音；获取所述第一语音的上一段语音对应的第一文本；获取第一集合，所述第一集合包括多个文本标识以及与所述多个文本标识中的每个文本标识对应的文本特征，所述文本特征为所述文本标识对应的文本的多种后续文本相关联的特征，所述文本特征与所述文本的多种后续文本在文本集合内的频次相关联，所述第一集合是基于所述文本集合确定得到的；基于所述第一文本和所述第一集合，确定所述第一语音相关联的文本内容。提高语音识别的准确度。技术研发人员：屠明,柳璐,夏瑞,李鑫,黄传增,王雨轩受保护的技术使用者：脸萌有限公司技术研发日：技术公布日：2024/5/12