智能设备的语音控制方法及装置、电子设备、存储介质与流程
- 国知局
- 2024-06-21 11:47:31
本发明涉及生物识别,具体而言,涉及一种智能设备的语音控制方法及装置、电子设备、存储介质。
背景技术:
1、随着信息技术和通信技术的不断进步,智能设备在人们的生活中愈发普及。金融机构引入智能设备(例如,业务大屏和客服机器人等),引导和辅助客户办理常规性大厅业务,减少客户的等待时间和人工办理时的错误风险,提高业务办理效率,同时保障客户的财产安全和信息安全。利用智能设备还可以实时监控业务办理过程、实时分析业务办理数据,为金融机构提供更加精准的风险控制和业务决策支持。
2、相关技术中,客户通常使用硬件控制器(例如,遥控器、键盘、鼠标)与智能设备进行交互,但是利用硬件控制器与智能设备进行交互的方式存在一些明显的缺陷:1)使用简单硬件控制器(例如,遥控器)与智能设备进行交互的情况下,若智能设备的服务内容产生变化(例如,智能设备展示界面展示的内容发生变化)时,遥控器需要进行同步换新,否则就会出现控制无效的情况,频繁更新硬件控制器会导致硬件成本过高;2)使用复杂硬件控制器(例如,键盘和鼠标)与智能设备进行交互的情况下,由于控制协议和设备兼容性等问题,容易误操作导致控制无效。
3、针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本发明实施例提供了一种智能设备的语音控制方法及装置、电子设备、存储介质,以至少解决相关技术中金融系统使用硬件控制器控制智能设备时容易出现误操作导致控制无效的技术问题。
2、根据本发明实施例的一个方面,提供了一种智能设备的语音控制方法,包括:采集语音指令数据,其中,所述语音指令数据是指在智能设备处于指令采集模式时采集得到的目标客户的语音片段;对所述语音指令数据进行文本转换,得到语音指令文本;基于所述语音指令文本在预设指令库中进行关键字匹配,得到匹配结果,其中,所述匹配结果中包含是否匹配成功的结论以及与所述语音指令文本匹配成功的预设控制指令;在所述匹配结果指示匹配成功的情况下,执行所述预设控制指令的指令内容,并将所述指令内容发送到所述智能设备的展示页面。
3、可选地,在采集语音指令数据之前,还包括:接收客户语音数据,其中,所述客户语音数据是指在所述智能设备处于待机模式时接收到的所述语音片段;将所述客户语音数据输入至唤醒模型,输出唤醒置信值,其中,所述唤醒模型基于指定唤醒关键字对所述客户语音数据进行置信检验,所述唤醒置信值表征所述客户语音数据包含所述指定唤醒关键字的概率;在所述唤醒置信值大于或等于预设置信阈值的情况下,将所述智能设备切换至指令采集模式;或者,在所述唤醒置信值小于所述预设置信阈值的情况下,向所述智能设备的所述展示页面发送唤醒失败通知。
4、可选地,在将所述客户语音数据输入至唤醒模型之前,还包括:对所述客户语音数据进行语音数据清洗,其中,所述语音数据清洗至少包括下述之一:去除背景音、降噪处理以及预加重处理。
5、可选地,对所述语音指令数据进行文本转换,得到语音指令文本的步骤,包括:对所述语音指令数据进行预处理操作,其中,所述预处理操作至少包括下述之一:去除静音片段、帧分割、降噪处理、加窗、预加重以及标准化处理;对预处理操作之后的所述语音指令数据中进行特征提取,得到声学特征序列,其中,所述声学特征序列包含所述语音指令数据中的所有声学特征向量,所述声学特征向量用于表征所述语音指令数据的时频特征和能量特征;将所述声学特征序列输入至语音识别模型,输出语音识别结果,其中,所述语音识别结果中包含所述语音指令数据对应的所述语音指令文本。
6、可选地,基于所述语音指令文本在预设指令库中进行关键字匹配,得到匹配结果的步骤,包括:基于预设关键字库提取所述语音指令文本中的关键字,其中,所述预设关键字库中预先存储了金融系统中用于描述控制动作的字符集合;基于预设匹配算法,将所述关键字与所述预设指令库中的任一所述预设控制指令进行匹配,得到所述匹配结果。
7、可选地,将所述指令内容发送到所述智能设备的展示页面的步骤,包括:将所述指令内容编译为json格式,得到指令编译结果;将所述指令编译结果发送至所述智能设备,由所述智能设备将json格式的指令内容与所述展示页面中的指定展示框进行融合,生成虚拟展示区,并在所述智能设备的所述展示页面上显示所述虚拟展示区。
8、可选地,所述预设指令库至少包括以下所述预设控制指令:延长当前页面展示时长、跳转至下一页面、查看某一区域数据和查看某一选项详情。
9、根据本发明实施例的另一方面,还提供了一种智能设备的语音控制装置,包括:采集单元,用于采集语音指令数据,其中,所述语音指令数据是指在智能设备处于指令采集模式时采集得到的目标客户的语音片段;文本转换单元,用于对所述语音指令数据进行文本转换,得到语音指令文本;关键字匹配单元,用于基于所述语音指令文本在预设指令库中进行关键字匹配,得到匹配结果,其中,所述匹配结果中包含是否匹配成功的结论以及与所述语音指令文本匹配成功的预设控制指令;执行单元,用于在所述匹配结果指示匹配成功的情况下,执行所述预设控制指令的指令内容,并将所述指令内容发送到所述智能设备的展示页面。
10、可选地,所述智能设备的语音控制装置还包括:接收模块,用于接收客户语音数据,其中,所述客户语音数据是指在所述智能设备处于待机模式时接收到的所述语音片段;第一输入模块,用于将所述客户语音数据输入至唤醒模型,输出唤醒置信值,其中,所述唤醒模型基于指定唤醒关键字对所述客户语音数据进行置信检验,所述唤醒置信值表征所述客户语音数据包含所述指定唤醒关键字的概率;切换模块,用于在所述唤醒置信值大于或等于预设置信阈值的情况下,将所述智能设备切换至指令采集模式;第一发送模块,用于在所述唤醒置信值小于所述预设置信阈值的情况下,向所述智能设备的所述展示页面发送唤醒失败通知。
11、可选地,所述智能设备的语音控制装置还包括:数据清洗模块,用于对所述客户语音数据进行语音数据清洗,其中,所述语音数据清洗至少包括下述之一:去除背景音、降噪处理以及预加重处理。
12、可选地,所述文本转换单元包括:预处理模块,用于对所述语音指令数据进行预处理操作,其中,所述预处理操作至少包括下述之一:去除静音片段、帧分割、降噪处理、加窗、预加重以及标准化处理;特征提取模块,用于对预处理操作之后的所述语音指令数据中进行特征提取,得到声学特征序列,其中,所述声学特征序列包含所述语音指令数据中的所有声学特征向量,所述声学特征向量用于表征所述语音指令数据的时频特征和能量特征;第二输入模块,用于将所述声学特征序列输入至语音识别模型,输出语音识别结果,其中,所述语音识别结果中包含所述语音指令数据对应的所述语音指令文本。
13、可选地,所述关键字匹配单元包括:提取模块,用于基于预设关键字库提取所述语音指令文本中的关键字,其中,所述预设关键字库中预先存储了金融系统中用于描述控制动作的字符集合;匹配模块,用于基于预设匹配算法,将所述关键字与所述预设指令库中的任一所述预设控制指令进行匹配,得到所述匹配结果。
14、可选地,所述执行单元包括:编译模块,用于将所述指令内容编译为json格式,得到指令编译结果;第二发送模块,用于将所述指令编译结果发送至所述智能设备,由所述智能设备将json格式的指令内容与所述展示页面中的指定展示框进行融合,生成虚拟展示区,并在所述智能设备的所述展示页面上显示所述虚拟展示区。
15、可选地,所述预设指令库至少包括以下所述预设控制指令:延长当前页面展示时长、跳转至下一页面、查看某一区域数据和查看某一选项详情。
16、根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述任意一项所述的智能设备的语音控制方法。
17、根据本发明实施例的另一方面,还提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项所述的智能设备的语音控制方法。
18、本公开中,提出一种智能设备的语音控制方法,先在智能设备处于指令采集模式时采集目标客户的语音片段作为语音指令数据,再对语音指令数据进行文本转换,得到语音指令文本,然后基于语音指令文本在预设指令库中进行关键字匹配,得到匹配结果,其中,匹配结果中包含是否匹配成功的结论以及与语音指令文本匹配成功的预设控制指令,最后在匹配结果指示匹配成功的情况下,执行预设控制指令的指令内容,并将指令内容发送到智能设备的展示页面。
19、本公开中,利用语音识别技术将采集得到的目标客户语音指令数据转换为语音指令文本,利用自然语言处理技术对语音指令文本与智能设备的预设指令库中的所有预设控制指令进行关键字匹配,执行匹配成功的预设控制指令并将该预设控制指令的指令内容发送到智能设备的展示页面。本公开提供的智能设备的语音控制方法结合语音识别技术和自然语言处理技术,通过金融机构的业务办理系统自动识别目标客户的语音指令数据来匹配智能设备能够识别的预设控制指令,执行该预设控制指令的指令内容,所有的有效语音输入都会被转换成合法指令,实现无需引入其他硬件控制器的效果,进而解决了相关技术中金融系统使用硬件控制器控制智能设备时容易出现误操作导致控制无效的技术问题。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23588.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表