技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于智能音箱的问答控制方法、装置、计算机设备和介质与流程  >  正文

基于智能音箱的问答控制方法、装置、计算机设备和介质与流程

  • 国知局
  • 2024-06-21 11:33:37

本发明涉及计算机,特别是涉及一种基于智能音箱的问答控制系统、一种基于智能音箱的问答控制方法和一种基于智能音箱的问答控制装置、一种计算机设备及一种存储介质。

背景技术:

1、随着科技的进步,音箱的功能越来越多,智能音箱技术逐渐成熟与商业化。智能音箱本身可以输出播放语音、音乐等,还能接受用户的语音与用户进行对话的交互。智能音箱一般是通过意图识别的方式来识别出用户的问题,从而输出相关的答案,但是,现有意图识别模型的硬件对于运行速度,响应时间等要求较高,模型训练时间较长,硬件成本较高,导致现在的智能音箱语音识别率很难有很大的提升。

技术实现思路

1、鉴于上述问题,提出了本实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于智能音箱的问答控制方法、一种基于智能音箱的问答控制系统、一种基于智能音箱的问答控制装置、一种计算机设备及一种存储介质。

2、为了解决上述问题,本实施例公开了一种基于智能音箱的问答控制方法,包括:

3、第一智能音箱获取所在的第一特定空间的第一语音数据;

4、第一智能音箱将所述第一语音数据发送第一路由器,所述第一路由器包含第一意图识别模型;所述第一路由器通过第一意图识别模型将所述第一语音数据转化为第一文本数据,将所述第一文本数据转化为第一意图特征,根据第一意图特征输出第一意图结果;其中,所述第一文本数据包含意图关键字;

5、所述第一路由器将第一文本数据及第一意图结果发送至总路由器;所述总路由器包含第三意图识别模型;所述总路由器通过所述第三意图识别模型将所述第一文本数据转化为第三意图特征,根据第三意图特征输出第三意图结果;

6、所述总路由器分别计算所述意图关键字与所述第一意图结果、所述第三意图结果的相似度,得到第一特征相似度、第三特征相似度,确定所述第一特征相似度及第三特征相似度高的特征相似度为意图相似度,输出所述意图相似度对应的意图结果至第一智能音箱。

7、优选地,所述方法还包括:

8、第二智能音箱获取所在的第二特定空间的第二语音数据;

9、第二智能音箱将所述第二语音数据发送第二路由器,所述第二路由器包含第二意图识别模型;所述第二路由器通过第二意图识别模型将所述第二语音数据转化为第二文本数据,将所述第二文本数据转化为第二意图特征,根据第二意图特征输出第二意图结果;其中,所述第二文本数据包含意图关键字;

10、所述第二路由器将第二文本数据及第二意图结果发送至总路由器;所述总路由器包含第三意图识别模型;所述总路由器通过所述第三意图识别模型将所述第二文本数据转化为第四意图特征,根据第四意图特征输出第四意图结果;

11、所述总路由器分别计算所述意图关键字与所述第二意图结果、所述第四意图结果的相似度,得到第二特征相似度、第四特征相似度,确定所述第二特征相似度及第四特征相似度高的特征相似度为意图相似度,输出所述意图相似度对应的意图结果至第二智能音箱。

12、优选地,所述第一意图识别模型包括训练后的歌曲意图模型;所述歌曲意图模型的训练步骤包括:

13、将语音数据转换为文本数据,得到文本数据训练集及歌曲分类意图标签;将所述文本数据训练集进行编码特征转换,得到编码特征;

14、将所述编码特征进行池化操作,得到池化后的语音特征;

15、将所述语音特征输入至全连接层得到输出的估算意图,根据估算意图、歌曲分类意图标签得到歌曲意图损失函数;

16、根据所述歌曲意图损失函数调节该意图识别模型的参数,得到训练后的歌曲意图模型。

17、优选地,所述第二意图识别模型包括训练后的电器控制意图模型;所述电器控制意图模型的训练步骤包括:

18、将语音数据转换为文本数据,得到文本数据训练集及电器控制分类意图标签;将所述文本数据训练集进行编码特征转换,得到编码特征;

19、将所述编码特征进行池化操作,得到池化后的语音特征;

20、将所述语音特征输入至全连接层得到输出的估算意图,根据估算意图、电器控制分类意图标签得到电器控制意图损失函数;

21、根据所述电器控制意图损失函数调节该意图识别模型的参数,得到训练后的电器控制意图模型。

22、优选地,所述第三意图识别模型包括训练后的搜索意图模型;所述搜索意图模型的训练步骤包括:

23、将语音数据转换为文本数据,得到文本数据训练集及搜索分类意图标签;将所述文本数据训练集进行编码特征转换,得到编码特征;

24、将所述编码特征进行池化操作,得到池化后的语音特征;

25、将所述语音特征输入至全连接层得到输出的估算意图,根据估算意图、搜索分类意图标签得到搜索意图损失函数;

26、根据所述搜索意图损失函数调节该意图识别模型的参数,得到训练后的歌曲意图模型。

27、优选地,所述方法还包括:

28、计算歌曲意图损失函数、电器控制意图损失函数、搜索意图损失函数三者的综合损失函数;

29、根据所述综合损失函数调节意图识别模型的参数,得到训练后的综合意图识别模型。

30、优选地,所述方法还包括:

31、获取到预设时间间隔后未被重复提问的语音数据,将所述语音数据转化为文本数据训练集,将所述语音数据对应的意图结果确定为意图标签,通过所述文本数据训练集及意图标签训练初始的意图识别模型。

32、本实施例公开了一种基于智能音箱的问答控制系统,包括:

33、第一智能音箱、第一路由器、第二智能音箱、第二路由器、第三智能音箱及总路由器;

34、所述总路由器分别与所述第一路由器、所述第二路由器、所述第三智能音箱连接,所述第一路由器与所述第一智能音箱连接,所述第二路由器与所述第二智能音箱连接;

35、所述第一路由器与第一智能音箱设置于第一特定空间内;所述第二路由器与第二智能音箱设置于第二特定空间;所述总路由器与第三智能音箱设置于第三特定空间内;所述第一特定空间、所述第二特定空间与所述第三特定空间是相邻的三个空间;

36、所述第一智能音箱、第二智能音箱及第三智能音箱用于接收语音数据;所述第一路由器设置有第一意图识别模型;所述第二路由器设置有第二意图识别模型;所述总路由器设置有第三意图识别模型。

37、本实施例公开一种基于智能音箱的问答控制装置,包括:

38、第一获取模块,用于第一智能音箱获取所在的第一特定空间的第一语音数据;

39、第一输出模块,用于第一智能音箱将所述第一语音数据发送第一路由器,所述第一路由器包含第一意图识别模型;所述第一路由器通过第一意图识别模型将所述第一语音数据转化为第一文本数据,将所述第一文本数据转化为第一意图特征,根据第一意图特征输出第一意图结果;其中,所述第一文本数据包含意图关键字;

40、第一发送模块,用于所述第一路由器将第一文本数据及第一意图结果发送至总路由器;所述总路由器包含第三意图识别模型;所述总路由器通过所述第三意图识别模型将所述第一文本数据转化为第三意图特征,根据第三意图特征输出第三意图结果;

41、第一确定模块,用于所述总路由器分别计算所述意图关键字与所述第一意图结果、所述第三意图结果的相似度,得到第一特征相似度、第三特征相似度,确定所述第一特征相似度及第三特征相似度高的特征相似度为意图相似度,输出所述意图相似度对应的意图结果至第一智能音箱。

42、本实施例还公开了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的基于智能音箱的问答控制的步骤。

43、本实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于智能音箱的问答控制的步骤。

44、本实施例包括以下优点:

45、本发明实施例中,在路由器的芯片及储存器中设置有人工智能模型,通过分布式的人工智能模型进行多空间的语音识别,实现了分布式的人工智能模型,不需要很高的硬件成本,降低硬件成本,减少训练时间,提高运行效率,提高智能音箱的语音识别率。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22246.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。