基于语音交互的电器工作模式切换方法及系统与流程
- 国知局
- 2024-06-21 11:56:19
本发明涉及语音识别,尤其涉及一种基于语音交互的电器工作模式切换方法及系统。
背景技术:
1、随着智能家居技术的不断发展,研究人员和工程师们一直在努力改进智能家居系统的用户体验和自动化能力。传统的智能家居系统主要依赖于用户手动控制,这会对用户造成不便,特别是在繁忙或情感状态不稳定时。因此,研究人员开始探索如何通过结合语音识别、情感分析和智能电器控制等技术,实现更智能、个性化的智能家居系统。
2、传统的智能家居系统主要依赖于用户的手动控制,这种方式在某些情境下会引发不便,同时,目前的情感识别模型虽然能够分析用户的情感,但准确性仍有改进空间。某些情感,特别是复杂的情感状态,难以准确捕捉,因此,现有方案中在基于语音交互对电器工作模式进行切换时准确率不足。
技术实现思路
1、本发明提供了一种基于语音交互的电器工作模式切换方法及系统,用于提高基于语音交互的电器工作模式切换的准确率。
2、本发明第一方面提供了一种基于语音交互的电器工作模式切换方法,所述基于语音交互的电器工作模式切换方法包括:
3、获取目标用户的指令音频数据,对所述指令音频数据进行指令关键词提取,得到目标指令关键词;
4、对所述指令音频数据进行音频特征提取,得到音频特征集合,其中,所述音频特征集合包括语速特征数据以及音调特征数据;
5、对接入预置的物联网中预置的多个目标电器进行关联关系分析,得到每两个所述目标电器的关联关系度;
6、基于每个两个所述目标电器的关联关系度对多个所述目标电器进行网络拓扑模型构建,得到电器拓扑模型;
7、通过所述目标指令关键词对所述电器拓扑模型进行相关电器匹配,得到至少两个第一候选电器;
8、通过所述音频特征集合对所述目标用户进行用户情绪识别,得到用户情绪数据,同时,通过所述用户情绪数据对至少两个所述候选电器进行电器筛选,得到至少一个第二候选电器;
9、对所述用户情绪数据以及所述目标指令关键词进行编码融合,得到编码融合向量,并将所述编码融合向量输入预置的电器工作模式分析模型进行工作模式分析,得到工作模式数据,并通过所述工作模式数据控制至少一个所述第二候选电器进行电器工作模式切换。
10、结合第一方面,在本发明第一方面的第一实施方式中,所述获取目标用户的指令音频数据,对所述指令音频数据进行指令关键词提取,得到目标指令关键词,包括:
11、获取所述指令音频数据,对所述指令音频数据进行降噪处理,得到降噪音频数据;
12、对所述降噪音频数据进行音频分割处理,得到多个分割音频数据;
13、对多个所述分割音频数据进行关键音频数据提取,得到关键音频数据;
14、对所述关键音频数据进行主成分分析,得到所述关键音频数据对应的主成分音频数据;
15、对所述主成分音频数据进行音频数据编码,得到对应的编码音频数据;
16、对所述编码音频数据进行向量转换,得到对应的音频向量矩阵,并将所述音频向量矩阵输入预置的关键词提取模型进行关键词提取,得到对应的目标指令关键词,其中,所述目标指令关键词包括电器开关指令以及模式调节指令。
17、结合第一方面,在本发明第一方面的第二实施方式中,所述对所述指令音频数据进行音频特征提取,得到音频特征集合,其中,所述音频特征集合包括语速特征数据以及音调特征数据,包括:
18、对所述指令音频数据进行时间序列提取,得到所述指令音频数据对应的时间序列数据;
19、对所述时间序列数据进行音频分割帧数计算,得到目标音频分割帧数;
20、通过所述目标音频分割帧数对所述指令音频数据进行音频分帧处理,得到多个音频帧数据;
21、分别对每个所述音频帧数据进行短时能量计算,得到每个所述音频帧数据对应的短时能量数据;
22、分别对每个所述音频帧数据进行过零率计算,得到每个所述音频帧数据对应的过零率数据;
23、基于每个所述音频帧数据对应的短时能量数据以及每个所述音频帧数据对应的过零率数据,对每个所述音频帧数据进行语速计算,得到每个所述音频帧数据对应的语速数据;
24、根据每个所述音频帧数据对应的语速数据,对所述指令音频数据进行语速特征分析,得到所述语速特征数据;
25、对每个所述音频帧数据进行音调特征提取,得到所述音调特征数据,并将所述语速特征数据以及所述音调特征数据进行数据合并,得到所述音频特征集合。
26、结合第一方面的第二实施方式,在本发明第一方面的第三实施方式中,所述对每个所述音频帧数据进行音调特征提取,得到所述音调特征数据,并将所述语速特征数据以及所述音调特征数据进行数据合并,得到所述音频特征集合,包括:
27、分别对每个所述音频帧数据进行频域数据转换,得到每个所述音频帧数据对应的频域信号数据;
28、通过每个所述音频帧数据对应的频域信号数据,对多个所述音频帧数据进行频谱图构建,得到目标频谱图;
29、对所述目标频谱图进行基音频率计算,得到目标基音频率数据;
30、对所述目标基音频率数据进行音高计算,得到对应的初始音调数据;
31、对所述初始音调数据进行数据标准化处理,得到对应的音调特征数据,并将所述语速特征数据以及所述音调特征数据进行数据合并,得到所述音频特征集合。
32、结合第一方面,在本发明第一方面的第四实施方式中,所述通过所述音频特征集合对所述目标用户进行用户情绪识别,得到用户情绪数据,同时,通过所述用户情绪数据对至少两个所述候选电器进行电器筛选,得到至少一个第二候选电器,包括:
33、将所述音频特征集合中的语速特征集合按时间步展开,得到第一输入序列;
34、将所述音频特征集合中的音调特征集合按时间步展开,得到第二输入序列;
35、对所述第一输入序列以及所述第二输入序列进行数据融合,得到融合输入序列;
36、将所述融合输入序列输入预置的循环神经网络进行情感标签识别,得到对应的目标情感标签;
37、通过所述目标情感标签从预置的情感数据库中进行情感数据采集,得到所述用户情绪数据;
38、通过所述用户情绪数据对至少两个所述候选电器进行电器筛选,得到至少一个第二候选电器。
39、结合第一方面的第四实施方式,在本发明第一方面的第五实施方式中,所述通过所述用户情绪数据对至少两个所述候选电器进行电器筛选,得到至少一个第二候选电器,包括:
40、对所述用户情绪数据进行情感分数计算,得到对应的情感分数值;
41、通过预置的分值范围表对所述情感分数值进行情感分类,得到对应的情感分类结果;
42、对多个所述目标电器进行电器参数采集,得到电器参数集合;
43、通过所述电器参数集合对多个所述目标电器进行电器触发参数匹配,得到每个所述目标电器对应的电器触发参数;
44、基于预置的情感分值映射表,通过每个所述目标电器对应的电器触发参数以及所述情感分类结果对至少两个所述候选电器进行电器筛选,得到至少一个第二候选电器。
45、结合第一方面,在本发明第一方面的第六实施方式中,所述对所述用户情绪数据以及所述目标指令关键词进行编码融合,得到编码融合向量,并将所述编码融合向量输入预置的电器工作模式分析模型进行工作模式分析,得到工作模式数据,并通过所述工作模式数据控制至少一个所述第二候选电器进行电器工作模式切换,包括:
46、对所述用户情绪数据进行编码向量长度标定,得到第一编码向量长度;
47、基于所述第一编码向量长度,对所述用户情绪数据进行分段编码,得到多个第一编码数据,并对多个所述第一编码数据进行数据融合,得到第一目标数据;
48、对所述目标指令关键词进行编码向量长度标定,得到第二编码向量长度;
49、基于所述第二编码向量长度,对所述目标指令关键词进行分段编码,得到多个第二编码数据,并对多个所述第二编码数据进行数据融合,得到第二目标数据;
50、对所述第一目标数据以及所述第二目标数据进行融合向量转换,得到所述编码融合向量;
51、将所述编码融合向量输入预置的电器工作模式分析模型进行工作模式分析,得到工作模式数据,并通过所述工作模式数据控制至少一个所述第二候选电器进行电器工作模式切换。
52、本发明第二方面提供了一种基于语音交互的电器工作模式切换系统,所述基于语音交互的电器工作模式切换系统包括:
53、获取模块,用于获取目标用户的指令音频数据,对所述指令音频数据进行指令关键词提取,得到目标指令关键词;
54、提取模块,用于对所述指令音频数据进行音频特征提取,得到音频特征集合,其中,所述音频特征集合包括语速特征数据以及音调特征数据;
55、分析模块,用于对接入预置的物联网中预置的多个目标电器进行关联关系分析,得到每两个所述目标电器的关联关系度;
56、构建模块,用于基于每个两个所述目标电器的关联关系度对多个所述目标电器进行网络拓扑模型构建,得到电器拓扑模型;
57、匹配模块,用于通过所述目标指令关键词对所述电器拓扑模型进行相关电器匹配,得到至少两个第一候选电器;
58、识别模块,用于通过所述音频特征集合对所述目标用户进行用户情绪识别,得到用户情绪数据,同时,通过所述用户情绪数据对至少两个所述候选电器进行电器筛选,得到至少一个第二候选电器;
59、融合模块,用于对所述用户情绪数据以及所述目标指令关键词进行编码融合,得到编码融合向量,并将所述编码融合向量输入预置的电器工作模式分析模型进行工作模式分析,得到工作模式数据,并通过所述工作模式数据控制至少一个所述第二候选电器进行电器工作模式切换。
60、本发明第三方面提供了一种基于语音交互的电器工作模式切换设备,包括:存储器和至少一个处理器,所述存储器中存储有指令;所述至少一个处理器调用所述存储器中的所述指令,以使得所述基于语音交互的电器工作模式切换设备执行上述的基于语音交互的电器工作模式切换方法。
61、本发明的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的基于语音交互的电器工作模式切换方法。
62、本发明提供的技术方案中,获取目标用户的指令音频数据,对指令音频数据进行指令关键词提取,得到目标指令关键词;对指令音频数据进行音频特征提取,得到音频特征集合,其中,音频特征集合包括语速特征数据以及音调特征数据;对接入预置的物联网中预置的多个目标电器进行关联关系分析,得到每两个目标电器的关联关系度;基于每个两个目标电器的关联关系度对多个目标电器进行网络拓扑模型构建,得到电器拓扑模型;通过目标指令关键词对电器拓扑模型进行相关电器匹配,得到至少两个第一候选电器;通过音频特征集合对目标用户进行用户情绪识别,得到用户情绪数据,同时,通过用户情绪数据对至少两个候选电器进行电器筛选,得到至少一个第二候选电器;对用户情绪数据以及目标指令关键词进行编码融合,得到编码融合向量,并将编码融合向量输入预置的电器工作模式分析模型进行工作模式分析,得到工作模式数据,并通过工作模式数据控制至少一个第二候选电器进行电器工作模式切换。在本技术方案中,通过分析目标用户的情感和指令,可以根据用户的情绪和需求自动调整电器设备的工作模式,提供个性化的体验。本方法可以令智能家居自动识别用户的指令,并根据用户的情感状态进行电器设备的控制。这减轻了用户的手动干预,并提供更便捷的家庭环境管理。通过电器关联关系分析和网络拓扑模型构建,可以更智能地管理多个电器设备。将语音指令和情感数据结合使用,提供了更丰富的智能家居交互方式。用户可以通过语音指令传达指令,并且可以根据情感数据理解用户的情感需求。通过关联关系分析、拓扑模型构建和情感识别,变得更智能,能够理解用户的意图,并作出相应的响应。提高了自动化和智能性,以进一步提高基于语音交互的电器工作模式切换的准确率。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24587.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。