技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种语音识别方法、系统和相关装置与流程 > 正文

一种语音识别方法、系统和相关装置与流程

国知局
2024-06-21 11:50:05

本申请涉及语音识别，特别是涉及一种语音识别方法、系统和相关装置。

背景技术：

1、随着全球化的不断深入发展，为了使得表达内容更加明确，人们越来越多地面临着多语混说的场景。现有的语音识别技术通过神经网络模型实现，该神经网络模型通过利用大量的训练样本进行训练得到，且训练后得到的神经网络模型在对于单一语种的识别方面具有较出色的效果，但对于包含多个语种的语音数据识别效果较为有限。

2、有鉴于此，如何准确且高效地实现对包含多个语种的语音进行识别，成为亟待解决的问题。

技术实现思路

1、本申请主要解决的技术问题是提供一种语音识别方法、系统和相关装置，能够提高语音识别的准确性。

2、为解决上述技术问题，本申请采用的一个技术方案是：提供一种语音识别方法，包括：获取用户输入的语音数据，基于所述语音数据，获取对应的声学特征；基于历史识别文本对应的语种信息，获取当前识别轮次下与至少一个目标语种匹配的初始识别特征；其中，所述语种信息与历史识别文本中目标语种对应的识别内容或所述识别内容的位置相关；基于所述声学特征和所述初始识别特征，获取当前识别轮次对应的当前识别文本。

3、为解决上述技术问题，本申请采用的另一个技术方案是：提供一种语音识别系统，包括：第一获取模块，用于获取用户输入的语音数据，基于所述语音数据，获取对应的声学特征；第二获取模块，用于基于历史识别文本对应的语种信息，获取当前识别轮次下与至少一个目标语种匹配的初始识别特征；其中，所述语种信息与历史识别文本中目标语种对应的识别内容或所述识别内容的位置相关；识别模块，用于基于所述声学特征和所述初始识别特征，获取当前识别轮次对应的当前识别文本。

4、为解决上述技术问题，本申请采用的另一个技术方案是：提供一种电子设备，包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现上述技术方案中提到的语音识别方法。

5、为解决上述技术问题，本申请采用的另一个技术方案是：提供一种计算机可读存储介质，存储有能够被处理器运行的程序指令，所述程序指令用于上述技术方案中提到的语音识别方法。

6、本申请的有益效果是：区别于现有技术的情况，本申请提出的语音识别方法，通过根据历史识别文本中每个目标语种对应的识别内容或每个目标语种对应的识别内容在历史识别文本中的位置信息，确定历史识别文本对应的语种信息。从而在语音识别过程中，结合语音识别模型已经输出的历史识别文本以及历史识别文本对应的语种信息，使得在识别过程中，语音识别模型对不同目标语种所对应的内容进行区分，并更加关注相同目标语种对应的内容之间的关联信息，从而提高语音识别的准确性。

技术特征：

1.一种语音识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于历史识别文本对应的语种信息，获取当前识别轮次下与至少一个目标语种匹配的初始识别特征，包括：

3.根据权利要求1所述的方法，其特征在于，响应于所述语种信息与所述识别内容的位置相关，所述基于历史识别文本对应的语种信息，获取当前识别轮次下与至少一个目标语种匹配的初始识别特征，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述特征序列，得到与至少一个所述目标语种匹配的所述初始识别特征，包括：

5.根据权利要求3所述的方法，其特征在于，训练后的语音识别模型中包含与每个所述目标语种匹配的分析子网络，所述基于所述特征序列，得到与至少一个所述目标语种匹配的所述初始识别特征，包括：

6.根据权利要求2-5中任一项所述的方法，其特征在于，所述基于所述声学特征和所述初始识别特征，获取当前识别轮次对应的当前识别文本，包括：

7.根据权利要求6所述的方法，其特征在于，所述基于所述声学特征和所述初始识别特征，获取当前识别轮次对应的当前识别文本之后，还包括：

8.一种语音识别系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括相互耦接的存储器和处理器，所述存储器中存储有程序指令，所述处理器用于执行所述程序指令以实现权利要求1-7任一项所述语音识别方法。

10.一种计算机可读存储介质，其特征在于，存储有能够被处理器运行的程序指令，所述程序指令用于实现权利要求1-7任一项所述的语音识别方法。

技术总结本申请公开了一种语音识别方法、系统和相关装置，该方法包括：获取用户输入的语音数据，基于所述语音数据，获取对应的声学特征；基于历史识别文本对应的语种信息，获取当前识别轮次下与至少一个目标语种匹配的初始识别特征；其中，所述语种信息与历史识别文本中目标语种对应的识别内容或所述识别内容的位置相关；基于所述声学特征和所述初始识别特征，获取当前识别轮次对应的当前识别文本。通过上述方式，本申请能够提高识别的准确性。技术研发人员：胡今朝,吴重亮,李永超,吴明辉受保护的技术使用者：科大讯飞股份有限公司技术研发日：技术公布日：2024/5/8