技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于利用持续学习的唤醒词检测的系统、方法和装置与流程  >  正文

用于利用持续学习的唤醒词检测的系统、方法和装置与流程

  • 国知局
  • 2024-06-21 11:30:24

本公开内容总体涉及电子装置,并且更具体地,涉及由这样的电子装置执行的音频信号检测。

背景技术:

1、音频和语音控制能力可以应用于各种背景下的系统和装置,例如智能装置和智能电器。这样的智能装置可以包括被配置成响应语音命令的智能助理(还被称为虚拟助理)。例如,用户可以提供可以触发智能装置的激活的特定短语。这样的短语可以包括唤醒智能装置的一个或更多个特定唤醒词,并且可以使智能装置执行一个或更多个操作。用于处理这样的唤醒词的常规技术仍然受到限制,因为这些常规技术在以功率有效的方式识别这样的唤醒词的能力方面受到限制。

技术实现思路

1、根据本发明的实施例,提供了一种方法,包括:在音频前端电路处接收音频输入;使用第一电路、至少部分地基于接收到的音频信号来识别唤醒词;以及至少部分地基于与所述第一电路相关联的指定的准确度阈值和所述识别的结果来确定是否应当修改由所述第一电路执行的所述识别,所述指定的准确度阈值至少部分地基于第二电路的语言处理模型来确定,以及所述修改包括:至少部分地基于所述确定的结果来调节所述第一电路的唤醒词检测操作。

2、根据本发明的实施例,还提供了一种系统,包括:音频前端电路,其被配置成接收音频输入;包括一个或更多个处理器的第一电路,所述一个或更多个处理器被配置成至少部分地基于接收到的音频输入来识别唤醒词;以及包括一个或更多个处理器的学习模块,所述一个或更多个处理器被配置成:至少部分地基于与所述第一电路相关联的指定的准确度阈值和所述识别的结果来确定是否应当修改由所述第一电路执行的所述识别,所述指定的准确度阈值至少部分地基于第二电路的语言处理模型来确定,所述一个或更多个处理器还被配置成至少部分地基于所述确定的结果来调节所述第一电路的唤醒词检测操作。

3、根据本发明的实施例,还提供了装置,包括:第一电路,其被配置成至少部分地基于接收到的音频输入来识别唤醒词;以及包括一个或更多个处理器的学习模块,所述一个或更多个处理器被配置成至少部分地基于与所述第一电路相关联的指定的准确度阈值和所述识别的结果来确定是否应当修改由所述第一电路执行的所述识别,所述指定的准确度阈值至少部分地基于第二电路的语言处理模型来确定,所述一个或更多个处理器还被配置成至少部分地基于所述确定的结果来调节所述第一电路的唤醒词检测操作。

技术特征:

1.一种方法,包括:

2.根据权利要求1所述的方法,其中,所述第一电路以第一功率电平操作,并且所述第二电路以第二功率电平操作。

3.根据权利要求2所述的方法,其中,所述第二功率电平高于所述第一功率电平。

4.根据权利要求1所述的方法,其中,所述指定的准确度阈值表示指定的正确唤醒词识别的百分比。

5.根据权利要求4所述的方法,其中,至少部分地基于与所述第一电路相关联的潜在空间中的多个统计分布来确定所述指定的准确度阈值。

6.根据权利要求5所述的方法,其中,至少部分地基于第一分布与第二分布之间的差来确定所述指定的准确度阈值。

7.根据权利要求1所述的方法,其中,所述语言处理模型在与所述第一电路相关联的潜在空间中表示所述第二电路。

8.根据权利要求7所述的方法,其中,基于所述第二电路的一个或更多个唤醒词识别操作来更新所述语言处理模型。

9.根据权利要求1所述的方法,其中,所述修改还包括:

10.一种系统,包括:

11.根据权利要求10所述的系统,其中,所述第一电路以第一功率电平操作,并且所述第二电路以第二功率电平操作,并且其中,所述第二功率电平高于所述第一功率电平。

12.根据权利要求10所述的系统,其中,所述指定的准确度阈值表示指定的正确唤醒词识别的百分比。

13.根据权利要求12所述的系统,其中,至少部分地基于与所述第一电路相关联的潜在空间中的多个统计分布来确定所述指定的准确度阈值。

14.根据权利要求13所述的系统,其中,至少部分地基于第一分布与第二分布之间的差来确定所述指定的准确度阈值。

15.根据权利要求10所述的系统,其中,所述语言处理模型在与所述第一电路相关联的潜在空间中表示所述第二电路,并且其中,基于所述第二电路的一个或更多个唤醒词识别操作来更新所述语言处理模型。

16.一种装置,包括:

17.根据权利要求16所述的装置,其中,所述第一电路以第一功率电平操作,并且所述第二电路以第二功率电平操作,并且其中,所述第二电功率电平高于所述第一功率电平。

18.根据权利要求16所述的装置,其中,所述指定的准确度阈值表示指定的正确唤醒词识别的百分比。

19.根据权利要求18所述的装置,其中,至少部分地基于与所述第一电路相关联的潜在空间中的多个统计分布来确定所述指定的准确度阈值,并且其中,至少部分地基于第一分布与第二分布之间的差来确定所述指定的准确度阈值。

20.根据权利要求16所述的装置,其中,所述语言处理模型在与所述第一电路相关联的潜在空间中表示所述第二电路,并且其中,基于所述第二电路的一个或更多个唤醒词识别操作来更新所述语言处理模型。

技术总结公开了用于利用持续学习的唤醒词检测的系统、方法和装置。系统、方法和装置检测音频信号。方法可以包括:在音频前端电路处接收音频输入,以及使用第一电路、至少部分地基于接收到的音频信号来识别唤醒词。方法还可以包括:至少部分地基于与第一电路相关联的指定的准确度阈值和识别的结果来确定是否应当修改由第一电路执行的识别,指定的准确度阈值至少部分地基于第二电路的语言处理模型来确定。此外,修改可以包括:至少部分地基于确定的结果来调节第一电路的唤醒词检测操作。技术研发人员:阿舒托什·潘迪,丹尼尔·沃森,艾当·史密斯受保护的技术使用者:赛普拉斯半导体公司技术研发日:技术公布日:2024/2/25

本文地址:https://www.jishuxx.com/zhuanli/20240618/21925.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。