技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于深度学习的智能语音控制系统及方法与流程  >  正文

基于深度学习的智能语音控制系统及方法与流程

  • 国知局
  • 2024-06-21 11:26:52

本技术涉及语音控制领域,且更为具体地,涉及一种基于深度学习的智能语音控制系统及方法。

背景技术:

1、语音控制是指通过语音命令与设备或系统进行交互和控制的技术,它基于语音识别、自然语言处理和语音合成等技术,使用户能够通过口头指令来操作设备、执行任务或获取信息,而无需使用键盘、鼠标或触摸屏等传统输入方式。语音控制技术已经广泛应用于各个智能领域,包括智能助理、智能家居、智能开门等,通过语音控制,用户可以方便地与设备或系统进行交互,实现更加便捷化的操作体验。

2、然而,尚没有将语音控制应用于智慧教室的控制方案,目前教室开门主要依靠人工操作,人工操作可能需要一定的时间来响应和执行开门请求,这会浪费一定的时间,尤其在高峰期或人员较多的情况下,学生或教师可能需要等待一段时间才能进入教室,影响到教学和学习的效率。同时可能存在人为错误和疏忽的风险,例如,有可能忘记锁门或忘记关门,导致安全隐患或能源浪费。随着智能技术的不断发展,将语音控制应用于智慧教室的控制已经成为一个值得探索的领域,通过语音控制,教室开门的过程可以更加智能化和自动化,为教室管理和使用带来便利和效率。

3、因此,期望一种基于深度学习的智能语音控制系统及方法。

技术实现思路

1、为了解决上述技术问题,提出了本技术。本技术的实施例提供了一种一种基于深度学习的智能语音控制系统及方法,其首先获取智慧教室待检测语音信息和从数据库白名单中调取的多个已授权用户的语音信息,然后,将所述待检测语音信息进行降噪后进行语义编码并通过二维排列以得到待检测语音特征矩阵,接着,将所述多个已授权用户的语音信息经过傅里叶变换后进行排列并通过语义编码以得到多个已授权语音特征矩阵,最后,构建所述待检测语音特征矩阵和所述多个已授权语音特征矩阵之间的优化相似度关联特征矩阵并通过分类器,以判断智慧教室门锁语音对比认证结果是否通过,进而为智慧教室提供了一种先进的语音控制解决方案,从而提升了教学环境的智能化和便捷性。

2、根据本技术的一个方面,提供了一种基于深度学习的智能语音控制系统,其包括:

3、语音信息获取模块,用于获取智慧教室待检测语音信息和从数据库白名单中调取的多个已授权用户的语音信息;

4、语音信息特征提取模块,用于从智慧教室待检测语音信息和多个已授权用户的语音信息中提取待检测语音特征矩阵和多个已授权语音特征矩阵;

5、相似度构造模块,用于构造所述待检测语音特征矩阵和所述多个已授权语音特征矩阵之间的优化相似度关联特征矩阵;

6、认证结果生成模块,用于基于所述优化相似度关联特征矩阵,判断智慧教室门锁语音对比认证结果是否通过。

7、在上述基于深度学习的智能语音控制系统中,所述语音信息特征提取模块,包括:语音信息预处理单元,用于对所述智慧教室待检测语音信息和多个已授权用户的语音信息进行语音信息预处理以得到降噪后待检测语音信息和已授权语音二维输入矩阵;待检测语音特征提取单元,用于对所述降噪后待检测语音信息进行特征提取以得到所述待检测语音特征矩阵;已授权语音特征提取单元,用于对所述已授权语音二维输入矩阵进行特征提取以得到所述多个已授权语音特征矩阵。

8、在上述基于深度学习的智能语音控制系统中,所述语音信息预处理单元,包括:待检测语音降噪子单元,用于将所述智慧教室待检测语音信息通过基于自动编码器的降噪模块以得到所述降噪后待检测语音信息;已授权语音标准化子单元,用于将所述多个已授权用户的语音信息进行语音信息标准化以得到所述已授权语音二维输入矩阵。

9、在上述基于深度学习的智能语音控制系统中,所述已授权语音标准化子单元,包括:将所述多个已授权用户的语音信息进行分帧后进行傅里叶变换以得到多个已授权用户语音特征向量;将所述多个已授权用户语音特征向量进行排列以得到所述已授权语音二维输入矩阵。

10、在上述基于深度学习的智能语音控制系统中,所述待检测语音特征提取单元,包括:将所述降噪后待检测语音信息通过包含嵌入层的待检测语音信息的上下文编码器以得到多个待检测语音特征向量;将所述多个待检测语音特征向量进行二维排列以得到所述待检测语音特征矩阵。

11、在上述基于深度学习的智能语音控制系统中,所述已授权语音特征提取单元,包括:将所述已授权语音二维输入矩阵通过包含嵌入层的已授权语音信息的上下文编码器以得到所述多个已授权语音特征矩阵。

12、在上述基于深度学习的智能语音控制系统中,所述相似度构造模块,包括:欧氏距离计算单元,用于计算所述待检测语音特征矩阵和所述多个已授权语音特征矩阵中的各个已授权语音特征矩阵之间的欧式距离以得到相似度关联矩阵;相似度关联单元,用于将所述相似度关联矩阵通过作为特征提取器的卷积神经网络以得到相似度关联特征矩阵;相似度优化单元,用于对所述相似度关联特征矩阵进行优化以得到所述优化相似度关联特征矩阵。

13、在上述基于深度学习的智能语音控制系统中,所述相似度优化单元,包括:以如下优化公式提取所述相似度关联特征矩阵的相对于目标分类函数的运动分布模型的隐特征表达以得到优化相似度关联特征矩阵;其中,所述优化公式为:

14、

15、其中,mi,j表示所述相似度关联特征矩阵的第(i,j)位置的特征值,log表示以2为底的对数函数值,softmax表示归一化指数函数,mi,j'表示所述优化相似度关联特征矩阵的第(i,j)位置的特征值。

16、根据本技术的另一方面,提供了一种基于深度学习的智能语音控制方法,其包括:

17、获取智慧教室待检测语音信息和从数据库白名单中调取的多个已授权用户的语音信息;

18、从智慧教室待检测语音信息和多个已授权用户的语音信息中提取待检测语音特征矩阵和多个已授权语音特征矩阵;

19、构造所述待检测语音特征矩阵和所述多个已授权语音特征矩阵之间的优化相似度关联特征矩阵;

20、基于所述优化相似度关联特征矩阵,判断智慧教室门锁语音对比认证结果是否通过。

21、在上述基于深度学习的智能语音控制方法中,从智慧教室待检测语音信息和多个已授权用户的语音信息中提取待检测语音特征矩阵和多个已授权语音特征矩阵,包括:对所述智慧教室待检测语音信息和多个已授权用户的语音信息进行语音信息预处理以得到降噪后待检测语音信息和已授权语音二维输入矩阵;待对所述降噪后待检测语音信息进行特征提取以得到所述待检测语音特征矩阵;对所述已授权语音二维输入矩阵进行特征提取以得到所述多个已授权语音特征矩阵。

22、与现有技术相比,本技术提供的一种基于深度学习的智能语音控制系统及方法,其首先获取智慧教室待检测语音信息和从数据库白名单中调取的多个已授权用户的语音信息,然后,将所述待检测语音信息进行降噪后进行语义编码并通过二维排列以得到待检测语音特征矩阵,接着,将所述多个已授权用户的语音信息经过傅里叶变换后进行排列并通过语义编码以得到多个已授权语音特征矩阵,最后,构建所述待检测语音特征矩阵和所述多个已授权语音特征矩阵之间的优化相似度关联特征矩阵并通过分类器,以判断智慧教室门锁语音对比认证结果是否通过,进而为智慧教室提供了一种先进的语音控制解决方案,从而提升了教学环境的智能化和便捷性。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21579.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。