技术新讯 > 乐器声学设备的制造及制作,分析技术 > 电子装置及其控制方法与流程  >  正文

电子装置及其控制方法与流程

  • 国知局
  • 2024-06-21 11:46:09

本公开涉及一种电子装置及其控制方法。更具体地,本公开涉及一种用于检测唤醒词是否被错误识别的电子装置及其控制方法。

背景技术:

1、近来,人工智能(ai)系统被用于各种领域。与现有的基于规则的智能系统不同,人工智能系统是一种机器自主进行学习、判断和智能化的系统。由于采用了人工智能系统,提高了识别率,能够更准确地理解用户的偏好,从而使现有的基于规则的智能系统逐渐被基于深度学习的人工智能系统所取代。

2、人工智能技术包括机器学习(例如,深度学习)和利用机器学习的元技术。机器学习是一种对输入数据本身的特征进行分类和学习的算法技术,而元技术是一种利用如深度学习等的机器学习算法来执行人脑的认知、判断等功能的技术。元技术包括语言理解、视觉理解、推理/预测、知识表示、运动控制等技术领域。特别地,语言理解是识别人类语言/文本并应用/处理人类语言/文本的技术,并且包括自然语言处理、机器翻译、交互系统、问答、语音识别/合成等。

3、最近,各种电子装置支持语音识别功能。电子装置的语音识别操作开始于识别唤醒词(例如,hi,bixby)的操作。因此,激活了语音识别功能的电子装置必须总是执行识别唤醒词的操作。这意味着诸如中央处理单元(cpu)或存储器的资源总是在电子装置中使用。

4、同时,在支持语音识别功能的电子装置中,可能存在具有如cpu或存储器的有限资源的电子装置。由于必须一直执行识别唤醒词的操作的特性,需要大量资源的高性能唤醒词检测模型不容易安装在这种电子装置中。为此,支持语音识别功能的一些电子装置不可避免地配备有性能有限的唤醒词检测模型,因此,可能发生唤醒词误识别。

5、因此,需要一种使用有限资源来防止唤醒词误识别的技术。

技术实现思路

1、[技术方案]

2、本公开的方面是解决至少上述问题和/或缺点,并提供至少下述优点。因此,本公开的一个方面是提供一种由本公开解决的技术任务,用于检测外部设备的唤醒词误识别。

3、本公开的另一个方面是提供一种由本公开解决的技术任务,用于防止外部设备的唤醒词误识别。

4、另外的方面将部分地在随后的描述中阐述,并且部分地将从描述中显而易见,或者可以通过所呈现的实施例的实践来获知。

5、根据本公开的一个方面,提供了一种电子装置。该电子装置包括具有通信电路的通信接口、被配置为存储至少一个指令的存储器和处理器,并且该处理器被配置为从外部设备接收被外部设备识别为唤醒词的第一音频,通过分析第一音频来确定第一音频是否对应于唤醒词,基于确定第一音频不对应于唤醒词,基于第一音频获得用于检测唤醒词误识别的神经网络模型,并将关于神经网络模型的信息发送到外部设备。

6、处理器可被配置为基于未检测到对应于第一音频的文本来确定第一音频不对应于唤醒词。

7、处理器可被配置为获得对应于第一音频的文本,且基于对应于第一音频的文本与唤醒词之间的相似性小于预定值,确定第一音频不对应于唤醒词。

8、处理器可被配置为从外部设备接收第一音频之后的第二音频,且通过分析第二音频来确定第一音频是否对应于唤醒词。

9、处理器可被配置为获得对应于第二音频的文本,且基于对应于第二音频的文本不具有预定句型结构,确定第一音频不对应于唤醒词。

10、第二音频可以包括关于当外部设备将第一音频识别为唤醒词时执行的操作的用户语音,并且处理器可以被配置为通过分析用户语音来确定第一音频是否对应于唤醒词。

11、处理器可被配置为基于经由外部设备提供的用户接口(ui)输入的用户反馈来确定第一音频是否对应于唤醒词。

12、处理器可被配置为基于确定第一音频不对应于唤醒词,将第一音频存储在存储器中,从存储在存储器中的第一音频中识别形成群组的多个音频,且基于多个第三音频训练神经网络模型。

13、根据本公开的另一方面,提供了一种电子装置的控制方法。该控制方法包括:从外部设备接收被外部设备识别为唤醒词的第一音频;通过分析第一音频来确定第一音频是否对应于唤醒词;基于确定第一音频不对应于唤醒词,基于第一音频获得用于检测唤醒词错误识别的神经网络模型;以及将关于神经网络模型的信息发送到外部设备。

14、确定第一音频是否对应于唤醒词可以包括:基于未检测到对应于第一音频的文本,确定第一音频不对应于唤醒词。

15、确定第一音频是否对应于唤醒词可以包括:获得对应于第一音频的文本,并且基于对应于第一音频的文本和唤醒词之间的相似性小于预定值,确定第一音频不对应于唤醒词。

16、该方法还可以包括从外部设备接收在第一音频之后的第二音频,并且确定第一音频是否对应于唤醒词可以包括通过分析第二音频来确定第一音频是否对应于唤醒词。

17、确定第一音频是否对应于唤醒词可以包括获得对应于第二音频的文本,并且基于对应于第二音频的文本不具有预定句型结构,确定第一音频不对应于唤醒词。

18、第二音频可以包括关于当外部设备将第一音频识别为唤醒词时执行的操作的用户语音,并且确定第一音频是否对应于唤醒词可以包括通过分析用户语音来确定第一音频是否对应于唤醒词。

19、确定第一音频是否对应于唤醒词可以包括基于通过外部设备提供的用户接口(ui)输入的用户反馈来确定第一音频是否对应于唤醒词。

20、获得神经网络模型可以包括,基于确定第一音频不对应于唤醒词,将第一音频存储在存储器中,从存储在存储器中的第一音频中识别形成群组的多个第三音频,以及基于多个第三音频训练神经网络模型。

21、根据实施例的用于解决任务的装置不限于上述装置,并且基于本说明书和附图,本公开所属领域的普通技术人员可以清楚地理解以上未提及的装置。

22、根据上述各种实施例,电子装置可以检测外部设备的唤醒词错误识别。此外,电子装置可以防止外部设备的唤醒词误识别。因此,可以提高用户的便利性。

23、此外,本公开的实施例可以获得或预测的效果直接或隐含地公开在本公开的实施例的详细描述中。例如,根据本公开的实施例预测的各种效果将在稍后将提供的详细描述中公开。

24、本公开的其它方面、优点和显著特征对于本领域技术人员而言将从以下结合附图的详细描述中变得显而易见。

技术特征:

1.一种装置,包括:

2.根据权利要求1所述的装置,其中,所述处理器进一步被配置为:基于没有检测到与所述第一音频对应的文本,确定所述第一音频不对应于所述唤醒词。

3.根据权利要求1所述的装置,其中,所述处理器进一步被配置为:

4.根据权利要求1所述的装置,其中,所述处理器进一步被配置为:

5.根据权利要求4所述的装置,其中,所述处理器进一步被配置为:

6.根据权利要求4所述的装置,其中:

7.根据权利要求1所述的装置,其中,所述处理器进一步被配置为基于用户反馈来确定所述第一音频是否对应于所述唤醒词,所述用户反馈通过所述外部设备提供的用户界面ui被输入。

8.根据权利要求1所述的装置,其中,所述处理器进一步被配置为:

9.一种控制电子装置的方法,所述方法包括:

10.根据权利要求9所述的方法,其中,确定所述第一音频是否对应于所述唤醒词包括:基于没有检测到与所述第一音频对应的文本,确定所述第一音频不对应于所述唤醒词。

11.根据权利要求9所述的方法,其中,确定所述第一音频是否对应于所述唤醒词包括:

12.根据权利要求9所述的方法,还包括:

13.根据权利要求12所述的方法,其中,确定所述第一音频是否对应于所述唤醒词包括:

14.根据权利要求12所述的方法,其中:

15.根据权利要求9所述的方法,还包括:

技术总结提供了一种电子装置。该电子装置包括具有通信电路的通信接口、被配置为存储至少一个指令的存储器和处理器,并且该处理器被配置为从外部设备接收被外部设备识别为唤醒词的第一音频,通过分析第一音频来确定第一音频是否对应于唤醒词,基于确定第一音频不对应于唤醒词,基于第一音频获得用于检测唤醒词误识别的神经网络模型,并将关于神经网络模型的信息发送到外部设备。技术研发人员:黄度衡,白玉姬,辛宗泳,李正元受保护的技术使用者:三星电子株式会社技术研发日:技术公布日:2024/4/24

本文地址:https://www.jishuxx.com/zhuanli/20240618/23446.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。