技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种农机无人驾驶语音识别的控制系统的制作方法  >  正文

一种农机无人驾驶语音识别的控制系统的制作方法

  • 国知局
  • 2024-06-21 11:33:52

本发明涉及语音识别,进一步涉及农机无人驾驶语音识别的控制功能,具体涉及一种农机无人驾驶语音识别的控制系统。

背景技术:

1、随着技术的发展与时代的进步,随着汽车行业的不断发展,目前汽车制造产业在原有提高汽车驾驶安全性和驾驶性能的基础上,更多地将研发目光投向自动驾驶领域,虽然目前无人驾驶技术无法在日常驾驶中使用,但在农用领域,由于农机驾驶速度偏低,因为无人驾驶农机成为目前的农机驾驶的主流。

2、在现有无人驾驶农机的控制方法中,通常采用平板电脑控制农机无人驾驶,平板电脑在收到农机启停的遥控指令后,会下发启停指令给控制器。目前的这种操作方式,在启动过程中可能产生人为操作失误二次点火,而且控制以及在控制线路故障时无法及时熄火损害农机,并带来安全性的问题。

3、为解决无人驾驶农机在启停过程中由于人为操作失误或控制线路故障对农机的损伤以及安全性问题,目前需要一种无人驾驶农机控制的启动停止控制系统,使农机在使用过程中即使出现人为操作失误或控制线路故障,仍能正常启停,提高农机无人驾驶的稳定性和安全性。

技术实现思路

1、本发明旨在针对现有技术的技术缺陷,提供一种农机无人驾驶语音识别的控制系统,以解决常规控制模式下容易因人为操作失误或控制线路故障而导致农机损伤及安全性风险的技术问题。

2、为实现以上技术目的,本发明采用以下技术方案:

3、一种农机无人驾驶语音识别的控制系统,包括语音识别部分,系统控制部分,语音提示回放部分,模/数转换部分;其特征在于:

4、语音识别部分包括语音信号预处理模块、特征提取模块、声学模型、模式匹配模块、语言模型与语言处理模块;

5、系统控制部分包括启停电路,检测组件,第一控制器,第二控制器;

6、语音识别部分通过声音采集,使用声音输入设备(如麦克风等)捕捉用户的语音信号;通过音频预处理,对采集到的声音进行预处理(包括去除噪音、调整音量等);特征提取模块将经过预处理的语音信号转化为表示语音特征的数学向量;语音识别模型训练,使用标注好的语音数据和对应的文本标签,训练语音识别模型(该模型可以基于传统的高斯混合模型gmm和隐马尔可夫模型hmm);文本解码,在实时应用中,识别到的语音特征被送入文本解码器,通过计算其与训练好的语音识别模型之间的匹配度,得到最可能的文本输出结果;意图理解和指令解析,将识别到的文本转化为可执行的操作步骤(这涉及到自然语言处理、机器学习和人工智能等技术,用来理解用户的意图和需求);操作执行,根据解析得到的指令,执行相应的操作;第一控制器,与启停电路连接,在接收启停控制指令后控制所述启停电路执行相应的启停操作;第二控制器,与启停电路和检测组件连接,接收当前启停状态和启停控制指令,并在所述启停电路的当前启停状态与启停控制指令不符时,控制所述启停电路执行相应的启停操作。

7、在以上技术方案中,通过音频预处理,对采集到的声音进行预处理,主要包括:采样和量化:将连续的声音信号转换为离散的数字形式。这包括使用麦克风采样声音信号,并将其量化为数字形式;滤波:常常使用数字滤波器对信号进行滤波,以去除不需要的频率成分;去噪:在信号中可能存在的噪声(环境噪声、电磁干扰等)可以通过谱减法来减弱;语音活动检测:识别语音信号中的活跃部分,有助于集中分析语音部分而减少处理的数据量;能量归一化:对信号进行能量归一化,以确保在不同语音片段之间有一致的能量水平;语音分割:将语音信号利用短时傅里叶变换分割成短时段;特征提取:从语音的每个短时段中提取有代表性的特征,如梅尔频率倒谱系数、音高、声谱包络等;标准化:对提取的特征进行标准化,确保它们在相同的尺度上,以提高模型的训练效果。语音识别模型训练,将预处理好的语音信息制作成一个数据集,然后进行人工标注,注明语音的来源,说话人标识和语音情感,使用标注好的语音数据和对应的文本标签,基于预训练的语音模型ctc训练自己的语音识别模型。

8、作为优选,声音由模拟-数字转换器进行输入;然后,通过端点检测来确定声音段的起止位置,接着进行特征提取,将声音转化成特征向量表示;这些特征向量被存储,并与预设的dtw模板进行匹配,以进行最终的语音识别决策。

9、作为优选,识别结果被发送给系统控制部分,该部分向第一控制器发送指令,控制电路的启动或停止;同时,检测组件监测启停电路是否按照指令执行,当不符合指令时,第二控制器介入控制启停电路。

10、作为优选,声音输入通过dac进行回放,语音编码将声音转化为数字编码形式,语音解码模块将编码还原为声音信号,语音提示模块播放指令的语音提示。

11、作为优选,声音由模拟-数字转换器进行输入,模拟-数字转换器将连续的模拟声音信号转换为离散的数字形式,以进行后续的数字信号处理或存储。

12、作为优选,所述语音识别部分包括端点检测模块,所述端点检测模块确定语音信号中开始和结束的时间点。

13、作为优选,所述特征提取模块提取的特征包括mfcc;特征提取步骤包括:预加重通过对语音信号进行高频增强来平衡频谱能量;分帧将语音信号分成若干短时帧,并应用窗函数对每帧信号进行加窗以减小频谱泄露;快速傅里叶变换对每帧信号进行fft转换,得到频谱图;梅尔滤波器组通过三角形滤波器将线性频谱转换为梅尔频谱;对数压缩对梅尔频谱取对数,将能量范围压缩到对数刻度上;离散余弦变换应用dct变换将对数压缩的梅尔频谱转换为倒谱系数;最终,mfcc得到描述语音特征的系数。

14、作为优选,语音识别部分包括模拟存储模块,模拟存储模块对模拟信号进行存储或记录。

15、作为优选,语音识别部分包括模块化模块,所述模块化模块将系统或软件划分为相互独立的功能模块,每个模块负责完成各自的任务。

16、作为优选,语音识别部分包括dtw模板匹配模块,所述dtw模板匹配模块创建距离矩阵计算两个时间序列中每个点之间的距离或相似度,并构建距离矩阵、初始化累积距离矩阵创建与原始距离矩阵相同大小的累积距离矩阵,并初始化第一行和第一列的累积距离值、计算累积距离矩阵通过选择上、左上、左这三个方向中的最小值,逐行逐列计算累积距离矩阵;回溯最佳路径从累积距离矩阵的右下角出发,根据选择最小值的方向进行回溯,找到最佳匹配路径、最后计算相似度或距离根据最佳匹配路径计算时间序列之间的相似度或距离;从而输出两个时间序列之间的相似度或距离,用于比较和分类不同的时间序列数据。

17、应用本发明,当启动过程中产生人为操作失误二次点火,控制以及在控制线路故障导致无法及时熄火时,仍可以正常启停。为农机无人驾驶中提供稳定性和安全性。

18、本发明通过语音识别技术实现无人驾驶农机的启停控制,可以提高操作的灵活性和效率,并且在出现人为操作失误、控制线路故障或操控装置断电等情况下依然能够有效地进行启停操作。为了保证系统的安全性,同时加入了保险措施,在控制指令与实际的情况不吻合的情况下还能控制启停电路进行响应操作,这对于保障农机无人驾驶的稳定性和安全性非常重要。这样的创新应用有助于提高农机作业的智能化程度,并减轻人工操作的负担。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22269.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。