技术新讯 > 乐器声学设备的制造及制作,分析技术 > 语音唤醒模型更新方法、存储介质、程序产品及设备与流程 > 正文

语音唤醒模型更新方法、存储介质、程序产品及设备与流程

国知局
2024-06-21 11:48:45

本申请实施例涉及人工智能领域，尤其涉及一种语音唤醒模型更新方法、存储介质、程序产品及设备。

背景技术：

1、目前，用户可以使用语音唤醒安装在电子设备上的语音助手应用程序，以为用户提供语音交互功能。例如，用户为语音助手设置的唤醒词(wake word)为“小艺，小艺”，电子设备实时监听外界的声音，当监听到用户输入包括唤醒词“小艺，小艺”的语音数据时，电子设备启动语音助手。然，经常存在用户使用唤醒词唤醒语音助手却唤醒失败的情形。

技术实现思路

1、本申请实施例公开了一种语音唤醒模型更新方法、存储介质、程序产品及设备，可以在用户无感知下更新唤醒模型，提高对用户声纹识别的能力，提升用户使用体验。

2、第一方面，本申请实施例提供一种语音唤醒模更新方法，应用于具备语音交互功能的电子设备，该语音唤醒模更新方法包括：获取包括唤醒词的第一语音数据，其中唤醒词是预先设置的用于唤醒语音交互功能的词；将第一语音数据输入至语音唤醒模型，以输出唤醒结果；在根据唤醒结果确定第一语音数据的声纹校验失败后，响应于根据非语音指令启动语音交互功能，获取第一数据与第二语音数据；响应于第一数据与预存的第二数据匹配，将第二语音数据用于更新语音唤醒模型，其中，预存的第二数据用于指示目标用户的身份信息。

3、在本申请实施例中，根据唤醒结果确定第一语音数据的声纹校验失败后，响应于根据非语音指令启动语音交互功能，获取用户的语音数据以及可用于指示用户身份的相关数据(第一数据)，在根据相关数据确认用户身份为目标用户后，根据用户的语音数据更新语音唤醒模型。由此无需用户到注册唤醒词界面重新操作注册流程来更新语音唤醒模型，实现在用户无感知情况下，将用户的语音数据用于更新训练语音唤醒模型，以提高语音唤醒率和唤醒体验。

4、在一种可能实现方式中，根据唤醒结果确定第一语音数据的声纹校验失败包括：当唤醒结果为失败时，检测到第一语音数据通过语音识别校验，且第一声纹置信度小于第一预设值，确定第一语音数据的声纹校验失败，其中第一声纹置信度用于指示第一语音数据的声纹与目标用户的声纹的声学特征相似度。

5、语音唤醒模型包括声纹校验，若第一声纹置信度小于第一预设值，也即第一语音数据的声纹校验未通过。确定与第一语音数据的声纹校验未通过，获取语音数据同时获取能证明用户身份的第一数据，在根据第一数据验证符合目标用户时，则说明所获得的语音数为目标用户，将目标用户的语音数据用于更新训练语音唤醒模型，以提高语音唤醒率和唤醒体验。

6、在一种可能实现方式中，当唤醒结果为失败时，检测到第一语音数据通过语音识别校验，且第一声纹置信度小于第一预设值，确定第一语音数据的声纹校验失败还包括：当唤醒结果为失败时，检测到第一语音数据通过语音识别校验，第一声纹置信度小于第一预设值且大于第二预设值时，确定第一语音数据的声纹校验失败，其中第二预设值小于第一预设值。在第一声纹置信度大于第二预设值时，即说明第一语音数据的声纹与目标用户的声纹的声学特征相似度达到一定阈值，可以较大可能保证该第一语音数据来自目标用户。

7、在一种可能实现方式中，将第二语音数据用于更新语音唤醒模型包括：当第一声纹置信度大于第三预设值时，将第一语音数据与第二语音数据用于更新语音唤醒模型，其中第三预设值大于第二预设值。在第一声纹置信度大于第二预设值时，即说明第一语音数据的声纹与目标用户的声纹的声学特征相似度达到一定阈值，可以保证该第一语音数据来自目标用户，则可以将第一语音数据以及第二语音数据同时用于更新训练语音唤醒模型，以提高语音唤醒率和唤醒体验。

8、在一种可能实现方式中，响应于根据非语音指令启动语音交互功能，获取第一数据与第二语音数据包括：响应于在预设时间内根据非语音指令启动语音交互功能，获取第二语音数据；当获取第二语音数据或执行第二语音数据对应的指令时，获取第一数据。

9、在预设时间内根据非语音指令启动语音交互功能，用户会向电子设备输入语音数据，获取用户所输入的第二语音数据。在获得第二语音数据或执行第二语音数据对应的指令时，获取第一数据。将获得的第一数据与预存的第二数据进行匹配，以在第一数据与预存的第二数据匹配时，可以将第二语音数据用于更新训练语音唤醒模型，以提高语音唤醒率和唤醒体验。

10、在一种可能实现方式中，该语音唤醒模型更新方法还包括：响应于获得第一数据或执行完成第二语音数据对应的指令，将第一数据与第二数据进行匹配。

11、在一种可能实现方式中，该语音唤醒模型更新方法还包括：响应于语音唤醒功能的开关处于开启状态，将第一数据与第二数据进行匹配。响应于语音唤醒功能的开关处于开启状态，确保用户后续还会继续使用语音唤醒功能，则将第一数据与第二数据进行匹配才有意义，以在第一数据与预存的第二数据匹配时，可以将第二语音数据用于更新训练语音唤醒模型，以提高语音唤醒率和唤醒体验。

12、在一种可能实现方式中，第一数据包括以下项中的至少一项：指纹数据、人脸数据、声纹数据、密码字符串、手势以及可信设备信息。可以理解，电子设备获取第一数据的时机可以为在注册唤醒词时，也可以为用户日常使用电子设备时，如用户设置手势密码解锁屏幕等。

13、在一种可能实现方式中，该语音唤醒模型更新方法还包括：显示第一用户界面，其中第一用户界面包括用于输入唤醒词的第一输入控件和用于输入第二数据的第二输入控件；响应于用户对第一输入控件的操作，获取唤醒词。响应于用户对第二输入控件的操作，获取第二数据。

14、第二方面，本申请实施例提供一种计算机可读存储介质，计算机可读存储介质包含用于执行根据如上述的语音唤醒模型更新方法的计算机可执行指令。

15、第三方面，本申请实施例提供一种包含指令的计算机程序产品，当计算机程序产品在电子设备上运行时，使得电子设备执行如上述语音唤醒模型更新方法。

16、第四方面，本申请实施例提供一种电子设备，包括：至少一个存储器，用于存储程序；和至少一个处理器，用于执行存储器存储的程序，当程序被处理器执行时，以使得电子设备执行如上述的语音唤醒模型更新方法。

17、上述其他方面对应的有益效果，可以参见关于方法方面的有益效果的描述，此处不予赘述。

技术特征：

1.一种语音唤醒模型更新方法，应用于具备语音交互功能的电子设备，其特征在于，所述方法包括：

2.根据权利要求1所述的语音唤醒模型更新方法，其特征在于，所述根据所述唤醒结果确定所述第一语音数据的声纹校验失败包括：

3.根据权利要求2所述的语音唤醒模型更新方法，其特征在于，所述当所述唤醒结果为失败时，检测到所述第一语音数据通过语音识别校验，且第一声纹置信度小于第一预设值，确定所述第一语音数据的所述声纹校验失败还包括：

4.根据权利要求3所述的语音唤醒模型更新方法，其特征在于，所述将所述第二语音数据用于更新所述语音唤醒模型包括：

5.根据权利要求1至4任一项所述的语音唤醒模型更新方法，其特征在于，所述响应于根据非语音指令启动所述语音交互功能，获取第一数据与第二语音数据包括：

6.根据权利要求5所述的语音唤醒模型更新方法，其特征在于，所述方法还包括：

7.根据权利要求1至6任一项所述的语音唤醒模型更新方法，其特征在于，所述方法还包括：

8.根据权利要求1至7任一项所述的语音唤醒模型更新方法，其特征在于，所述第一数据包括以下项中的至少一项：

9.根据权利要求1至8任一项所述的语音唤醒模型更新方法，其特征在于，所述方法还包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包含用于执行根据权利要求1至9中任一项所述的语音唤醒模型更新方法的计算机可执行指令。

11.一种包含指令的计算机程序产品，其特征在于，当所述计算机程序产品在电子设备上运行时，使得所述电子设备执行如权利要求1至9中任一项所述的语音唤醒模型更新方法。

12.一种电子设备，其特征在于，包括：

技术总结本申请提出一种语音唤醒模型更新方法、存储介质、程序产品及设备，涉及人工智能(artificial interlligence，AI)领域，应用于语音助手，该方法可以应用于语音助手也可以应用于电子设备，该方法包括获取包括唤醒词的第一语音数据，其中唤醒词是预先设置的用于唤醒语音交互功能的词；将第一语音数据输入至语音唤醒模型，以输出唤醒结果；在根据唤醒结果确定第一语音数据的声纹校验失败后，响应于根据非语音指令启动语音交互功能，获取第一数据与第二语音数据；响应于第一数据与预存的第二数据匹配，将第二语音数据用于更新语音唤醒模型，其中，预存的第二数据用于指示目标用户的身份信息。技术研发人员：张庭玉,吴晶受保护的技术使用者：华为终端有限公司技术研发日：技术公布日：2024/5/6