技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种针对不同方言的语音识别系统 > 正文

一种针对不同方言的语音识别系统

国知局
2024-06-21 11:55:34

本发明属于语音识别，具体涉及一种针对不同方言的语音识别系统。

背景技术：

1、语音识别技术是一种将语音信号转换为文本或命令的技术，它在现代计算机科学和人机交互中起着重要作用；传统的语音识别系统通常基于统计模型，如隐马尔可夫模型(hmm)或高斯混合模型(gmm)，这些模型使用特征提取和模式匹配技术来识别语音信号；

2、方言识别是语音识别技术的一个重要分支，它专注于区分不同地区或社区的语音特征，由于不同地区的语言和发音差异，传统的语音识别系统在处理方言时可能会遇到困难；

3、如现有的语音识别算法大多针对普通话或单一方言，当使用同一套语音识别算法识别多种不同方言时，容易将一种方言中的字词误识别为另一种方言中含义不同的字词。

技术实现思路

1、本发明的目的是提供一种针对不同方言的语音识别系统，能够对连续输入的不同方言的语音信号进行识别，而无需中途人工切换方言识别算法或模型，并且通过后处理模块进一步提高系统的识别准确率。

2、本发明采取的技术方案具体如下：

3、一种针对不同方言的语音识别系统，包括方言种类识别模块、语音识别模块和后处理模块；

4、所述方言种类识别模块用于识别出所输入语音信号的方言种类，并向语音信号添加方言种类标签；

5、所述语音识别模块用于对相应方言的语音信号进行识别，并输出识别出的语言信息文本；

6、所述后处理模块用于对语言信息文本中的错误文本进行修正，输出最终识别结果。

7、进一步地，所述方言种类识别模块包括特征提取模块、方言种类分类模块、标签添加模块

8、所述特征提取用于从输入的语音信号中提取声学特征；

9、所述方言种类分类模块用于使用机器学习模型对声学特征进行分类，以识别出语音信号的方言种类；

10、所述标签添加模块用于将识别出的方言种类标签添加到语音信号中。

11、进一步地，所述语音识别模块包括方言识别模型、模型选择模块；

12、所述模型选择模块用于根据语音信号的方言种类标签选择相应方言的方言识别模型；

13、所述方言识别模型用于对语音信号进行识别，并输出识别出的语言信息文本。

14、进一步地，所述后处理模块包括方言修正库、修正模块、多模态情感识别模块、语境处理模块和可信度评估模块；

15、所述方言修正库内部储存有和多个和各种方言种类标签相对应的方言修正列表；

16、所述修正模块用于根据方言修正列表对语言信息文本中的明显误识别文字进行修正；

17、所述多模态情感识别模块用于识别语音信号中的情感信息，分析用户的情感状态，并输出情感标签；

18、所述语境处理模块用于根据情感标签对语言信息文本中词语或短语进行识别和修正；

19、所述可信度评估模块用于对识别结果进行可信度评估，并标记出可信度低的识别结果。

20、进一步地，所述多模态情感识别模块包括情感特征提取模块、情感分析模块、情感修正模块和情感标签添加模块；

21、所述情感特征提取用于从语音信号中提取情感声学特征；

22、所述情感分析模块用于对提取的情感特征进行分类和分析，识别出语音信号中所包含的情感信息；

23、所述情感修正模块用于检索语音信号的上下文信息对情感信息进行修正；

24、所述情感标签添加模块用于根据情感信息分类结果，生成相应的情感标签。

25、本发明取得的技术效果为：

26、(1)本发明的一种针对不同方言的语音识别系统可以对连续输入的不同方言的语音信号进行识别，而无需中途人工切换方言识别算法或模型，并且通过后处理模块进一步提高系统的识别准确率。

技术特征：

1.一种针对不同方言的语音识别系统，其特征在于：包括方言种类识别模块、语音识别模块和后处理模块；

2.根据权利要求1所述的一种针对不同方言的语音识别系统，其特征在于：所述方言种类识别模块包括特征提取模块、方言种类分类模块、标签添加模块

3.根据权利要求1所述的一种针对不同方言的语音识别系统，其特征在于：所述语音识别模块包括方言识别模型、模型选择模块；

4.根据权利要求3所述的一种针对不同方言的语音识别系统，其特征在于：所述语音识别模块还包括降噪模块，所述降噪模块用于对输入的语音信号进行降噪处理。

5.根据权利要求4所述的一种针对不同方言的语音识别系统，其特征在于：所述降噪模块通过维纳滤波算法对语音信号进行降噪处理。

6.根据权利要求4所述的一种针对不同方言的语音识别系统，其特征在于：所述语音识别模块还包括语音截取模块，所述语音截取模块用于对降噪处理后的语音信号进行端点检测，截取保留有效语音部分，同时将该语音信号输出到模型选择模块。

7.根据权利要求1所述的一种针对不同方言的语音识别系统，其特征在于：所述后处理模块包括方言修正库、修正模块、多模态情感识别模块、语境处理模块和可信度评估模块；

8.根据权利要求7所述的一种针对不同方言的语音识别系统，其特征在于：所述多模态情感识别模块包括情感特征提取模块、情感分析模块、情感修正模块和情感标签添加模块；

技术总结本发明属于语音识别技术领域，具体涉及一种针对不同方言的语音识别系统，包括方言种类识别模块、语音识别模块和后处理模块；方言种类识别模块用于识别出所输入语音信号的方言种类，并向语音信号添加方言种类标签；语音识别模块用于对相应方言的语音信号进行识别，并输出识别出的语言信息文本；后处理模块用于对语言信息文本中的错误文本进行修正，输出最终识别结果。本发明可以对连续输入的不同方言的语音信号进行识别，而无需中途人工切换方言识别算法或模型，并且通过后处理模块进一步提高系统的识别准确率。技术研发人员：叶亮,谢璐,陈舒怡,常馨月,马琳,邓天昊,陈之旭,唐瑞丰受保护的技术使用者：哈尔滨工业大学技术研发日：技术公布日：2024/6/2