多语音设备的响应方法、装置和设备与流程
- 国知局
- 2024-06-21 11:40:39
本技术涉及语音,尤其涉及一种多语音设备的响应方法、装置和设备。
背景技术:
1、随着智能化的语音设备的普及,以家居场景为例,当家居环境中包括智能音响,智能开关等设备时,语音作为人机交互的重要方式,也越来越多地应用在各语音设备中。
2、语音唤醒作为一种重要的语音识别技术,其目地是让语音设备从待机状态进入工作状态,开始对用户的话语进行监听、识别与回应。在一个声学空间环境下,随着语音设备越来越多,当它们的唤醒词相同或相似时,可能出现用户一次唤醒,多个语音设备同时响应,这种“一呼百应”的效果,降低用户体验。
3、因此,在多语音设备的情况下,如何避免出现“一呼百应”的情况,从而提高语音唤醒的准确度,是本领域技术人员需要解决的技术问题。
技术实现思路
1、本技术提供一种多语音设备的响应方法、装置和设备,在多语音设备的情况下,避免出现“一呼百应”的情况,从而提高了语音唤醒的准确度。
2、本技术提供一种多语音设备的响应方法,应用于第一语音设备,所述方法包括:
3、针对语音信号源输出的语音唤醒信号,在第一相对方位下执行所述语音唤醒信号的接收操作,得到第一语音唤醒信号,所述第一相对方位为所述第一语音设备与所述语音信号源之间的相对方位;
4、从所述第一语音唤醒信号中提取第一语音信号特征,并向第二语音设备发送所述第一语音信号特征,所述第一语音信号特征用于所述第二语音设备基于对所述语音唤醒信号执行接收操作得到的第二语音唤醒信号和所述第一语音信号特征,确定是否向所述第一语音设备发送第二语音信号特征,所述第二语音信号特征为从所述第二语音唤醒信号中提取到的语音信号特征;
5、基于是否接收到所述第二语音信号特征,控制所述第一语音设备执行对应的操作,所述操作包括响应所述语音唤醒信号,或者,不响应所述语音唤醒信号。
6、根据本技术提供的一种多语音设备的响应方法,所述基于是否接收到所述第二语音信号特征,控制所述第一语音设备执行对应的操作,包括:
7、在接收到所述第二语音信号特征的情况下,控制所述第一语音设备不响应所述语音唤醒信号;
8、在未接收到所述第二语音信号特征的情况下,控制所述第一语音设备响应所述语音唤醒信号。
9、根据本技术提供的一种多语音设备的响应方法,所述在第一相对方位下执行所述语音唤醒信号的接收操作,得到第一语音唤醒信号,包括:
10、基于所述语音信号源的位置和所述第一语音设备的位置,确定所述语音信号源与所述第一语音设备之间的第一冲激响应;
11、基于所述语音唤醒信号和所述第一冲激响应,确定所述第一语音唤醒信号。
12、根据本技术提供的一种多语音设备的响应方法,在存在噪声信号源的情况下,所述基于所述语音唤醒信号和所述第一冲激响应,确定所述第一语音唤醒信号,包括:
13、基于所述噪声信号源的位置和所述第一语音设备的位置,确定所述噪声信号源与所述第一语音设备之间的第二冲激响应;
14、对所述语音唤醒信号、所述第一冲激响应和所述第二冲激响应进行卷积,得到所述第一语音唤醒信号。
15、根据本技术提供的一种多语音设备的响应方法,所述向第二语音设备发送所述第一语音信号特征,包括:
16、在未接收到所述第二语音设备发送的第二语音信号特征的情况下,向所述第二语音设备发送所述第一语音信号特征。
17、本技术还提供一种多语音设备的响应方法,应用于第二语音设备,所述方法包括:
18、针对语音信号源输出的语音唤醒信号,在第二相对方位下执行所述语音唤醒信号的接收操作,得到第二语音唤醒信号,所述第二相对方位为所述第二语音设备与所述语音信号源之间的相对方位;
19、从所述第二语音唤醒信号中提取第二语音信号特征;
20、接收第一语音设备发送的第一语音信号特征,所述第一语音信号特征为所述第一语音设备对所述语音唤醒信号执行接收操作得到的第一语音唤醒信号中提取的语音信号特征;
21、基于所述第一语音信号特征和所述第二语音信号特征,控制所述第二语音设备执行对应的操作,所述操作包括响应所述语音唤醒信号,或者,不响应所述语音唤醒信号。
22、根据本技术提供的一种多语音设备的响应方法,所述基于所述第一语音信号特征和所述第二语音信号特征,控制所述第二语音设备执行对应的操作,包括:
23、将所述第一语音信号特征和所述第二语音信号特征输入至语音响应模型中,得到响应指示信息,所述响应指示信息用于指示所述第二语音设备是否响应所述语音唤醒信号;
24、基于所述响应指示信息,控制所述第二语音设备执行对应的操作;
25、其中,所述语音响应模型是基于多个语音信号特征样本对和各所述语音信号特征样本对的响应指示信息标签训练得到的。
26、根据本技术提供的一种多语音设备的响应方法,所述基于所述响应指示信息,控制所述第二语音设备执行对应的操作,包括:
27、在所述响应指示信息指示所述第二语音设备不响应所述语音唤醒信号的情况下,控制所述第二语音设备不响应所述语音唤醒信号;
28、在所述响应指示信息指示所述第二语音设备响应所述语音唤醒信号的情况下,向所述第一语音设备和其他第二语音设备发送所述第二语音信号特征,所述第二语音信号特征用于指示所述第一语音设备不响应所述语音唤醒信号,并用于指示所述其他第二语音设备基于对所述语音唤醒信号执行接收操作得到的其他语音唤醒信号和所述第二语音信号特征,确定是否向所述第二语音设备发送其他语音信号特征,所述其他语音信号特征为从所述其他语音唤醒信号中提取到的语音信号特征;
29、基于是否接收到所述其他语音信号特征,控制所述第二语音设备执行对应的操作。
30、根据本技术提供的一种多语音设备的响应方法,所述基于是否接收到所述其他语音信号特征,控制所述第二语音设备执行对应的操作,包括:
31、在接收到所述其他语音信号特征的情况下,控制所述第二语音设备不响应所述语音唤醒信号;
32、在未接收到所述其他语音信号特征的情况下,控制所述第二语音设备响应所述语音唤醒信号。
33、根据本技术提供的一种多语音设备的响应方法,所述在第二相对方位下执行所述语音唤醒信号的接收操作,得到第二语音唤醒信号,包括:
34、基于所述语音信号源的位置和所述第二语音设备的位置,确定所述语音信号源与所述第二语音设备之间的第三冲激响应;
35、基于所述语音唤醒信号和所述第三冲激响应,确定所述第二语音唤醒信号。
36、根据本技术提供的一种多语音设备的响应方法,在存在噪声信号源的情况下,所述基于所述语音唤醒信号和所述第三冲激响应,确定所述第二语音唤醒信号,包括:
37、基于所述噪声信号源的位置和所述第二语音设备的位置,确定所述噪声信号源与所述第二语音设备之间的第四冲激响应;
38、对所述语音唤醒信号、所述第三冲激响应和所述第四冲激响应进行卷积,得到所述第二语音唤醒信号。
39、根据本技术提供的一种多语音设备的响应方法,针对所述多个语音信号特征样本对中的各语音信号特征样本对,所述语音信号特征样本对是基于下述操作获取的:
40、基于所述语音信号特征样本对的响应指示信息标签,确定多个样本语音设备中响应样本语音信号源的目标语音设备,所述样本语音信号源正对所述目标语音设备;
41、基于所述样本语音信号源的位置和朝向,确定第一模拟语音信号源和第二模拟语音信号源各自的位置,所述第一模拟语音信号源和所述第二模拟语音信号源到所述目标语音设备的距离相等;
42、基于所述样本语音信号源输出的样本语音唤醒信号、所述第一模拟语音信号源、所述第二模拟语音信号源和所述多个样本语音设备各自的位置,获取所述语音信号特征样本对。
43、根据本技术提供的一种多语音设备的响应方法,所述基于所述样本语音信号源输出的样本语音唤醒信号、所述第一模拟语音信号源、所述第二模拟语音信号源和所述多个样本语音设备各自的位置,获取所述语音信号特征样本对,包括:
44、基于所述样本语音唤醒信号、所述第一模拟语音信号源的位置、所述第二模拟语音信号源的位置和所述目标语音设备的位置,确定所述目标语音设备接收到的第一样本语音唤醒信号;
45、基于所述样本语音唤醒信号、所述第一模拟语音信号源的位置、所述第二模拟语音信号源的位置和所述多个样本语音设备中的其他语音设备的位置,确定所述其他语音设备接收到的第二样本语音唤醒信号;
46、从所述第一样本语音唤醒信号中提取第一样本语音信号特征,并从所述第二样本语音唤醒信号中提取第二样本语音信号特征,所述语音信号特征样本对包括所述第一样本语音信号特征和所述第二样本语音信号特征。
47、根据本技术提供的一种多语音设备的响应方法,所述基于所述样本语音唤醒信号、所述第一模拟语音信号源的位置、所述第二模拟语音信号源的位置和所述目标语音设备的位置,确定所述目标语音设备接收到的第一样本语音唤醒信号,包括:
48、基于所述第一模拟语音信号源的位置和所述目标语音设备的位置,确定所述第一模拟语音信号源与所述目标语音设备之间的第一样本冲激响应;
49、基于所述第二模拟语音信号源的位置和所述目标语音设备的位置,确定所述第二模拟语音信号源与所述目标语音设备之间的第二样本冲激响应;
50、基于所述样本语音唤醒信号、所述第一样本冲激响应和所述第二样本冲激响应,确定所述第一样本语音唤醒信号。
51、根据本技术提供的一种多语音设备的响应方法,在存在样本噪声信号源的情况下,所述基于所述样本语音唤醒信号、所述第一样本冲激响应和所述第二样本冲激响应,确定所述第一样本语音唤醒信号,包括:
52、基于所述样本噪声信号源的位置和所述目标语音设备的位置,确定所述样本噪声信号源与所述目标语音设备之间的第三样本冲激响应;
53、对所述样本语音唤醒信号、所述第一样本冲激响应、所述第二样本冲激响应和所述第三样本冲激响应进行卷积,得到所述第一样本语音唤醒信号。
54、本技术还提供一种多语音设备的响应装置,应用于第一语音设备,所述装置包括:
55、第一执行单元,用于针对语音信号源输出的语音唤醒信号,在第一相对方位下执行所述语音唤醒信号的接收操作,得到第一语音唤醒信号,所述第一相对方位为所述第一语音设备与所述语音信号源之间的相对方位;
56、第一提取单元,用于从所述第一语音唤醒信号中提取第一语音信号特征;
57、发送单元,用于向第二语音设备发送所述第一语音信号特征,所述第一语音信号特征用于所述第二语音设备基于对所述语音唤醒信号执行接收操作得到的第二语音唤醒信号和所述第一语音信号特征,确定是否向所述第一语音设备发送第二语音信号特征,所述第二语音信号特征为从所述第二语音唤醒信号中提取到的语音信号特征;
58、第一控制单元,用于基于是否接收到所述第二语音信号特征,控制所述第一语音设备执行对应的操作,所述操作包括响应所述语音唤醒信号,或者,不响应所述语音唤醒信号。
59、本技术还提供一种多语音设备的响应装置,应用于第二语音设备,所述装置包括:
60、第二执行单元,用于针对语音信号源输出的语音唤醒信号,在第二相对方位下执行所述语音唤醒信号的接收操作,得到第二语音唤醒信号,所述第二相对方位为所述第二语音设备与所述语音信号源之间的相对方位;
61、第二提取单元,用于从所述第二语音唤醒信号中提取第二语音信号特征;
62、接收单元,用于接收第一语音设备发送的第一语音信号特征,所述第一语音信号特征为所述第一语音设备对所述语音唤醒信号执行接收操作得到的第一语音唤醒信号中提取的语音信号特征;
63、第二控制单元,用于基于所述第一语音信号特征和所述第二语音信号特征,控制所述第二语音设备执行对应的操作,所述操作包括响应所述语音唤醒信号,或者,不响应所述语音唤醒信号。
64、本技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一方面任一项所述的多语音设备的响应方法,或者,执行所述程序时实现如上述第二方面任一项所述的多语音设备的响应方法。
65、本技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一项所述的多语音设备的响应方法,或者,实现如上述第二方面任一项所述的多语音设备的响应方法。
66、本技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述第一方面任一项所述的多语音设备的响应方法,或者,实现如上述第二方面任一项所述的多语音设备的响应方法。
67、本技术提供的多语音设备的响应方法、装置和设备,在多语音设备场景中,针对语音信号源输出的语音唤醒信号,第一语音设备在第一相对方位下执行语音唤醒信号的接收操作,得到第一语音唤醒信号;从第一语音唤醒信号中提取第一语音信号特征,并向第二语音设备发送第一语音信号特征,以使第二语音设备基于第二语音唤醒信号和第一语音信号特征,确定是否向第一语音设备发送第二语音信号特征;并基于是否接收到第二语音信号特征,控制第一语音设备执行对应的操作,操作包括响应语音唤醒信号,或者,不响应语音唤醒信号,这样基于两两比较的方法进行逐一判决确定响应语音唤醒信号的语音设备,避免出现“一呼百应”的情况,从而提高了语音唤醒的准确度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22845.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表