技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于AI的智能语音识别系统及方法与流程 > 正文

一种基于AI的智能语音识别系统及方法与流程

国知局
2024-06-21 11:29:28

本发明涉及语音识别，特别涉及一种基于ai的智能语音识别系统及方法。

背景技术：

1、随着ai智能的不断发展与更新，一些设备上已经搭载了智能语音识别系统，通过智能语音识别系统可以将使用者所表达的指令，转换为对应设备的控制指令，以此用于设备的语音控制。

2、现有的一些笔记本电脑会搭载一些语音控制设备进行电脑的辅助使用，如一些写字本，就可以通过语音控制实现同步打字记录，因此这门技术运用在笔记本电脑上之后，就能够帮助一些老年人辅助使用电脑，但是现有的关于指令控制类的智能语音识别系统其只能够识别普通话指令，这样就使得经常使用方言的人群不能够通过该类语音识别系统完成语音识别控制，进而使得他们没有办法体验到智能语音控制带来的操作便利。

技术实现思路

1、本发明的目的在于提供一种基于ai的智能语音识别系统及方法，以解决上述背景技术中提出的问题。

2、为实现上述目的，本发明提供如下技术方案：一种基于ai的智能语音识别系统，所述系统的组成包括语音信号接收单元、语音信号识别单元、语音信号转换单元、文字指令解析单元、指令控制单元、反馈单元和存储单元；

3、所述语音信号接收单元用于指令语音信号的接收；

4、所述语音信号识别单元用于语音信号接收单元获取的语音指令的识别，包括多种方言的识别；

5、所述语音信号转换单元用于将识别语音指令转化为可理解的文字和命令；

6、所述文字指令解析单元用于识别转换后文字和命令的关键词，并提取关键信息、进行语义分析和命令解释；

7、所述指令控制单元通过控制逻辑和执行模块将解析的命令转化为具体的操作和控制，包括计算机软件的开启及网站问题的搜索；

8、所述反馈单元用于展示识别的结果，并提供反馈和交互；

9、所述存储单元用于接收的语音信号及转换的文字和命令的存储。

10、优选的，所述语音信号接收单元用于将接收到的指令语音信号发送至语音信号识别单元和存储单元，所述语音信号转换单元用于将转换后的文字和命令发送至文字指令解析单元和存储单元。

11、优选的，所述文字指令解析单元用于将解析成功的指令发送至指令控制单元，且所述文字指令解析单元用于将解析失败的指令发送至反馈单元。

12、优选的，所述语音信号识别单元包括多语言语音数据集、声学模型、语言模型、语音预处理模块、多方言识别算法和实时识别引擎。

13、优选的，所述多语言语音数据集包含多种方言的语音样本，且包括多种语音特征和语音习惯用法；

14、所述声学模型用于将语音信号转化为文本；

15、所述语言模型用于理解和推测语音识别结果中的单词和句子；

16、所述语音预处理模块用于对接收的语音信号进行除噪音、标准化音频质量和提取语音特征；

17、所述多方言识别算法基于统计模型的方法和深度学习的方法，包括隐马尔可夫模型、循环神经网络和卷积神经网络；

18、所述实时识别引擎用于实时处理输入的语音信号并输出相应的识别结果。

19、优选的，所述语言模型包括多种方言的词汇和语法规则。

20、一种基于ai的智能语音识别方法，采用所述的语音识别系统，所述识别方法包括以下几个操作步骤：

21、第一步，语音信号接收单元接收用户表述的语音指令声音，并记录下该声音发送至语音信号识别单元内；

22、第二步，语音信号识别单元对获取的声音先进行预处理，然后再进行方言种类的识别和搭配，匹配完成之后将方言转换为普通话，并将转换的普通话发送至语音信号转换单元；

23、第三步，语音信号转换单元将获得的语音信号转换为文字或者指令并发送至文字指令解析单元；

24、第四步，文字指令解析单元对文字或者指令进行解析和理解，若是解析成功则将指令映射为对应的操作或功能，并将操作或者功能发送至指令控制单元，若解析失败，则将失败信息发送至反馈单元，反馈失败，并重新进行语音信息的获取；

25、第五步，指令控制单元接收到对应的操作指令或功能指令之后，执行相应的操作或控制系统，并由反馈单元进行对应功能的反馈。

26、优选的，所述第一步中语音指令的接收先从麦克风中接收语音信号，并使用放大器将其放大，然后使用模拟-数字转换器将其转换为数字信号。

27、优选的，所述第四步中文字指令解析包括自然语言处理和文本解析技术，用以将指令映射到特定的操作或功能。

28、优选的，所述第五步中指令控制是调用解析指令的特定函数、并触发相应的指令响应且执行指令动作。

29、本发明的技术效果和优点：

30、本发明的语音识别系统对语音信号识别单元进行了设计，通过多语言语音数据集、声学模型、语言模型和多方言识别算法的配合辅助，能够使得本语音识别系统可以对多种方言进行识别，并将其转换为普通话语数，进而能够完成对应的识别控制，这样将该语音识别系统搭载至笔记本这类电子设备内之后，就可以帮助方言使用人群进行语音识别控制。

技术特征：

1.一种基于ai的智能语音识别系统，其特征在于，所述系统的组成包括语音信号接收单元、语音信号识别单元、语音信号转换单元、文字指令解析单元、指令控制单元、反馈单元和存储单元；

2.根据权利要求1所述的一种基于ai的智能语音识别系统，其特征在于，所述语音信号接收单元用于将接收到的指令语音信号发送至语音信号识别单元和存储单元，所述语音信号转换单元用于将转换后的文字和命令发送至文字指令解析单元和存储单元。

3.根据权利要求1所述的一种基于ai的智能语音识别系统，其特征在于，所述文字指令解析单元用于将解析成功的指令发送至指令控制单元，且所述文字指令解析单元用于将解析失败的指令发送至反馈单元。

4.根据权利要求1所述的一种基于ai的智能语音识别系统，其特征在于，所述语音信号识别单元包括多语言语音数据集、声学模型、语言模型、语音预处理模块、多方言识别算法和实时识别引擎。

5.根据权利要求4所述的一种基于ai的智能语音识别系统，其特征在于，所述多语言语音数据集包含多种方言的语音样本，且包括多种语音特征和语音习惯用法；

6.根据权利要求5所述的一种基于ai的智能语音识别系统，其特征在于，所述语言模型包括多种方言的词汇和语法规则。

7.一种基于ai的智能语音识别方法，其特征在于，采用包括权利要求1-6任一项所述的语音识别系统，所述识别方法包括以下几个操作步骤：

8.根据权利要求7所述的一种基于ai的智能语音识别方法，其特征在于，所述第一步中语音指令的接收先从麦克风中接收语音信号，并使用放大器将其放大，然后使用模拟-数字转换器将其转换为数字信号。

9.根据权利要求7所述的一种基于ai的智能语音识别方法，其特征在于，所述第四步中文字指令解析包括自然语言处理和文本解析技术，用以将指令映射到特定的操作或功能。

10.根据权利要求7所述的一种基于ai的智能语音识别方法，其特征在于，所述第五步中指令控制是调用解析指令的特定函数、并触发相应的指令响应且执行指令动作。

技术总结本发明公开了一种基于AI的智能语音识别系统及方法，包括语音信号接收单元、语音信号识别单元、语音信号转换单元、文字指令解析单元、指令控制单元、反馈单元和存储单元；语音信号识别单元用于语音信号接收单元获取的语音指令的识别，包括多种方言的识别；语音信号转换单元用于将识别语音指令转化为可理解的文字和命令；文字指令解析单元用于识别转换后文字和命令的关键词，并提取关键信息、进行语义分析和命令解释。本发明的语音识别系统对语音信号识别单元进行了设计，通过多语言语音数据集、声学模型、语言模型和多方言识别算法的配合辅助，能够使得本语音识别系统可以对多种方言进行识别，进而能够完成对应的识别控制。技术研发人员：方涌彬,谢培川,张海龙受保护的技术使用者：富正通精密（深圳）有限公司技术研发日：技术公布日：2024/2/21