技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种无声语音识别方法及系统 > 正文

一种无声语音识别方法及系统

国知局
2024-06-21 11:58:25

本发明涉及语音识别，尤其涉及一种无声语音识别方法及系统。

背景技术：

1、语音识别指将人类的语音信息转换为计算机可处理的文字或命令，在实际生活场景中有声的语音识别技术已非常成熟，但由于在一些公共场合中因信息的私密性或者无法说话的语言残疾者需要沟通交流等需求，无声的语音识别有着重要的价值。

2、目前常见的无声语音识别方法多采用柔性压力传感器粘贴在喉咙上，采集发声时的声带振动信号，或者将器件贴附在面部，采集说话时面部肌电信号，再利用机器学习或深度学习算法实现无声语音的识别。但柔性压力传感器贴在喉咙和面部时，粘贴位置需要精确，同时也会受到吞咽，眨眼或头部、脸部运动等产生的其他电信号的干扰；此外，此类器件的长时间使用可能会存在位置偏移从而会影响信号的采集。而粘贴式的器件也会给用户者带来不适感，进而产生生理和心理的抵触情绪。

技术实现思路

1、有鉴于此，本发明实施例提供一种无声语音识别方法及系统，以解决目前识别无声语音较为困难的问题。

2、为实现上述目的，本发明实施例提供如下技术方案：

3、本发明第一方面公开了一种无声语音识别方法，所述方法包括：

4、采集用户的口腔区域的湿度，得到湿度信号，所述口腔区域为距离所述用户的口腔预设距离的区域；

5、对所述湿度信号进行预处理并提取时频特征，得到特征数据；

6、将所述特征数据输入至预先训练的识别模型中进行识别，得到识别结果并输出所述识别结果。

7、优选的，所述采集用户的口腔区域的湿度，得到湿度信号，包括：

8、利用无声语音采集设备采集用户的口腔区域的湿度，得到电容信号；

9、对所述电容信号进行滤波处理和模数转换处理，得到湿度信号。

10、优选的，所述对所述湿度信号进行预处理并提取时频特征，得到特征数据，包括：

11、对所述湿度信号进行去基线处理和数据归一化处理，得到目标信号；

12、对所述目标信号进行时域和频域分析并从所述目标信号中截取有效信号；

13、从所述有效信号中提取时频特征，得到特征数据。

14、优选的，所述从所述有效信号中提取时频特征，得到特征数据，包括：

15、根据所述有效信号中每帧信号的长度和信号值，计算所述有效信号的平均绝对幅值、均方根、斜率信号变化值和三阶矩；

16、根据所述有效信号确定求积区间，将所述求积区间划分为预设等份，并计算所述求积区间对应的步长；

17、基于所述步长和每个等分点，利用低阶求积公式计算每两个相邻等分点之间的积分值；

18、计算所有积分值的和，得到所述有效信号相应的复化梯形积分；

19、根据所述有效信号的所有能量谱密度值和所有频率值，计算平均频率；

20、计算所述有效信号相应的梅尔倒谱系数；

21、将所述平均绝对幅值、所述均方根、所述斜率信号变化值、所述三阶矩、所述复化梯形积分、所述平均频率和所有梅尔倒谱系数确定为所述有效信号对应的特征数据。

22、优选的，预先训练识别模型的过程，包括：

23、利用无声语音采集设备采集样本数据；

24、对所述样本数据进行预处理并提取时频特征，得到样本特征数据；

25、将所述样本特征数据划分为训练数据和验证数据，依据所述训练数据对机器学习模型进行训练直至机器学习模型收敛，得到识别模型；

26、利用所述验证数据验证所述识别模型的识别效果；

27、若所述识别效果满足预设条件，确定得到最终的识别模型；

28、若所述识别效果不满足预设条件，更新所述识别模型的参数，返回执行所述利用所述验证数据验证所述识别模型的识别效果这一步骤。

29、本发明第二方面公开了一种无声语音识别系统，所述系统包括：无声语音采集设备和无声语音信号分析模块；

30、所述无声语音采集设备和所述无声语音信号分析模块之间通过蓝牙通信连接；

31、所述无声语音采集设备设置于用户的口腔区域，所述口腔区域为距离所述用户的口腔预设距离的区域；

32、所述无声语音采集设备用于采集所述用户的所述口腔区域的湿度，得到湿度信号并将所述湿度信号发送至所述无声语音信号分析模块；

33、所述无声语音信号分析模块用于接收所述湿度信号并对所述湿度信号进行识别，得到识别结果并输出所述识别结果。

34、优选的，所述无声语音采集设备包括：头带、位置调整旋钮、传导杆、湿度传感器、读取电路和电池；

35、所述头带通过所述位置调整旋钮连接所述传导杆，使所述传导杆处于可旋转状态；

36、所述传导杆的末端设置有所述湿度传感器和所述读取电路，所述湿度传感器连接所述读取电路的一端；所述读取电路的另一端连接所述电池；

37、所述湿度传感器设置于所述用户的所述口腔区域，所述湿度传感器用于采集所述用户的所述口腔区域的湿度，得到电容信号；

38、所述读取电路用于将所述电容信号进行处理，得到湿度信号并通过蓝牙通信将所述湿度信号发送至所述无声语音信号分析模块；

39、所述电池用于为所述湿度传感器和所述读取电路进行供电。

40、优选的，所述无声语音信号分析模块包括识别模块和输出模块；

41、所述识别模块与所述输出模块相互连接；

42、所述识别模块用于接收所述无声语音采集设备发送的所述湿度信号，对所述湿度信号进行预处理并提取时频特征，得到特征数据，将所述特征数据输入至预先训练的识别模型中进行识别，得到识别结果并将所述识别结果发送至所述输出模块；

43、所述输出模块用于将所述识别结果进行输出。

44、优选的，所述读取电路包括信号获取模块、微控制单元和蓝牙模块；

45、所述信号获取模块连接所述微控制单元的一端，所述微控制单元的另一端连接所述蓝牙模块；

46、所述信号获取模块用于接收所述湿度传感器发送的所述电容信号，并将所述电容信号发送至所述微控制单元；

47、所述微控制单元用于将所述电容信号进行滤波处理和模数转换处理，得到湿度信号，并将所述湿度信号发送至所述蓝牙模块；

48、所述蓝牙模块用于将所述湿度信号发送至所述无声语音信号分析模块。

49、优选的，所述无声语音信号分析模块具体是智能终端设备。

50、基于上述本发明实施例提供的一种无声语音识别方法及系统，该方法包括利用无声语音采集设备中的湿度传感器采集用户的口腔区域的湿度，得到湿度信号；对湿度信号进行预处理并提取时频特征，得到特征数据；将特征数据输入至预先训练的识别模型中进行识别，得到识别结果并输出识别结果。通过非接触式的方法采集用户说话时口腔区域的湿度，使采集到的湿度信号不受其他信号影响，提高信号采集的抗干扰能力和稳定性；通过提取预处理后的湿度信号中的时频特征，得到特征数据，利用预先训练的识别模型识别特征数据得到识别结果，提高了识别结果的可靠性和准确性。