电子设备及其控制方法与流程
- 国知局
- 2024-06-21 11:50:11
本公开涉及一种电子设备及其控制方法。更具体地,本公开涉及可以通过语音识别来控制的电子设备及其控制方法。
背景技术:
1、随着技术的发展,由于在诸如智能电话和智能电视(tv)之类的显示设备中实现了用户语音识别,因此用户可以通过发出的语音来控制显示设备的操作或接收各种内容服务而无需额外的操作。
2、基于云的语音识别服务通常会基于自然语言理解(nlu)模块中的语音识别结果来确定功能操作的执行。当用户向电子设备输入语音指令时,语音识别服务器从电子设备接收语音指令并执行语音识别。语音识别服务器将语音识别结果发送到nlu模块(并可以另外将语音识别结果发送到电子设备以在电子设备中快速执行预先注册的指令),并且nlu模块可以分析语音识别结果以导出适当的功能执行方法,并将结果发送到电子设备。
3、然而,如果是难以处理nlu处理的情况,或者如果需要缩短响应时间,则可以仅通过nlu处理之前的语音识别结果来执行功能。例如,诸如电视之类的显示设备将语音识别结果与指令的文字进行比较,以便基于基本功能(“音量增大”,“频道增大”)的预注册指令和语音触摸(通过将显示在显示画面上的选择项的文本注册为指令,通过语音执行功能的技术)执行指令,并执行完全匹配的指令的功能。
4、但是,在该现有技术中,通过对指令和语音识别结果的文字进行比较来找到完全匹配的指令,并且如果指令记录中存在不匹配或指令的表示形式多样,则文字比较可能无法正确执行,因此,用户可能会对语音识别功能产生负面感觉。
技术实现思路
1、技术问题
2、本公开提供了一种能够根据各种记录方法来处理语音指令的电子设备及其控制方法。
3、技术方案
4、根据一个实施例的电子设备包括:语音输入器;存储装置,被配置为存储根据第一记录格式的第一文本和通过以第二记录格式记录所述第一文本而获得的至少一个第二文本;以及处理器,被配置为基于从通过所述语音输入器输入的用户语音转换得到的语音文本与预设指令对应,执行根据所述预设指令的功能,所述处理器被配置为基于所述预设指令包括所述第一文本,并且基于所述语音文本是所述预设指令的所述第一文本被记录为所述第二记录格式的第二文本后的文本,执行根据所述预设指令的功能。
5、所述语音文本可以被划分为预设文本单元,所述处理器被配置为:基于所述语音文本的文本单元中的至少一个包括所述第二文本,从所述存储装置中识别与所述第二文本中的每一个相对应的第一文本,并执行与基于所识别的所述第一文本和所述第二文本识别的指令相对应的功能。
6、处理器被配置为基于所述语音文本的文本单元和所识别的第一文本中的任何一个是否包括在所述预设指令中,计算所述预设指令与所述用户语音的第一相似度分数,并且基于计算出的所述第一相似度分数大于或等于预设阈值,执行根据所述预设指令的功能。
7、所述预设指令被划分为预设文本单元,所述处理器被配置为:基于所述预设指令的每个文本单元是否包括在所述语音文本的所述文本单元和所识别的第一文本中的任何一个中,进一步计算所述预设指令与所述用户语音的第二相似度分数,并基于计算出的所述第一相似度分数和所述第二相似度分数中的每一个大于或等于预设阈值,执行根据所述预设指令的功能。
8、该电子设备还可以包括显示器,并且所述预设指令可以显示在通过所述显示器提供的用户界面(ui)上。
9、处理器被配置为控制显示器以显示画面,所述画面是在其上执行根据所述预设指令的功能的画面。
10、电子设备还包括通信器,并且处理器被配置为控制所述通信器向与所述电子设备连接的显示设备发送提供画面的图像,所述画面是在其上执行根据所述预设指令的功能的画面。
11、语音输入器可以包括麦克风。
12、处理器被配置为控制所述通信器将通过所述语音输入器输入的所述用户语音发送给外部设备,并从所述外部设备接收根据语音识别从所述用户语音转换得到的语音文本。
13、第二文本是根据外来词记录格式、数字记录格式和符号记录形式中的至少一个与所述第一文本不同地记录的文本。
14、一种电子设备的控制方法,所述电子设备存储根据第一记录格式的第一文本和通过以第二记录格式记录所述第一文本而获得的至少一个第二文本,所述方法包括:接收用户语音;以及基于从输入的所述用户语音转换得到的语音文本与预设指令对应,执行根据所述预设指令的功能,所述执行可以包括:基于所述预设指令包括所述第一文本,并且基于所述语音文本是所述预设指令的所述第一文本被记录为所述第二记录格式的第二文本后的文本,执行根据所述预设指令的功能。
15、语音文本可以被划分为预设文本单元,并且执行可以包括:基于所述语音文本的文本单元中的至少一个包括所述第二文本,从存储装置中识别与所述第二文本中的每一个相对应的第一文本,并执行与基于所识别的所述第一文本和所述第二文本识别的指令相对应的功能。
16、执行可以包括基于所述语音文本的文本单元和所识别的第一文本中的任何一个是否包括在所述预设指令中,计算所述预设指令与所述用户语音的第一相似度分数;以及基于计算出的所述第一相似度分数大于或等于预设阈值,执行根据所述预设指令的功能。
17、预设指令可以被划分为预设文本单元,并且该方法可以包括:基于所述预设指令的每个文本单元是否包括在所述语音文本的所述文本单元和所识别的第一文本中的任何一个中,计算所述预设指令与所述用户语音的第二相似度分数,所述执行可以包括:基于计算出的所述第一相似度分数和所述第二相似度分数中的每一个大于或等于预设阈值,执行根据所述预设指令的功能。
18、该方法还可以包括:显示包括预设指令的用户界面(ui);以及显示画面,所述画面是在其上执行根据所述预设指令的功能的画面。
19、该控制方法还可以包括:向与所述电子设备连接的显示设备发送提供画面的图像,所述画面是在其上执行根据所述预设指令的功能的画面。
20、该方法还可以包括:将通过语音输入器输入的所述用户语音发送给外部设备,并从所述外部设备接收根据语音识别从所述用户语音转换得到的语音文本。
21、预设文本单元可以包括词、数字或符号中的至少一个。
22、接收用户语音还包括从用于控制所述电子设备的遥控设备接收用户语音。
23、第二文本可以是根据外来词记录格式、数字记录格式和符号记录形式中的至少一个与第一文本不同地记录的文本。
24、发明效果
25、根据各种实施例,即使语音识别结果和指令记录之间不匹配,也可以执行根据用户意图的指令功能,从而提高用户的满意度和便利性。
技术特征:1.一种电子设备,包括:
2.根据权利要求1所述的电子设备,其中,所述第一用户语音输入是用户发出第一语言的第一文本的语音的语音输入,并且
3.根据权利要求2所述的电子设备,其中,所述第一语言是韩语,所述第二语言是英语。
4.根据权利要求1所述的电子设备,其中,所述第一用户语音输入对应于所述电子设备的显示器上显示的文本,并且
5.根据权利要求1所述的电子设备,还包括:
6.根据权利要求5所述的电子设备,其中,所述第一ui与所述第二ui相同。
7.根据权利要求1所述的电子设备,还包括:
8.根据权利要求1所述的电子设备,其中,与所述第一用户语音输入相对应的所述第一数据包括与所述第一用户语音输入相关的第一文本,其中,与所述第二用户语音输入相对应的所述第二数据包括与所述第二用户语音输入相关的第二文本,并且其中,所述处理器被配置为:
9.一种用于控制电子设备的方法,所述方法包括:
10.根据权利要求9所述的方法,其中,所述第一用户语音输入是用户发出第一语言的第一文本的语音的语音输入,并且
11.根据权利要求10所述的方法,其中,所述第一语言是韩语,所述第二语言是英语。
12.根据权利要求9所述的方法,其中,所述第一用户语音输入对应于所述电子设备的显示器上显示的文本,并且
13.根据权利要求9所述的方法,还包括:
14.根据权利要求13所述的方法,其中,所述第一ui与所述第二ui相同。
15.根据权利要求9所述的方法,
16.根据权利要求9所述的方法,其中,与所述第一用户语音输入相对应的所述第一数据包括与所述第一用户语音输入相关的第一文本,
17.一种非暂时性计算机可读记录介质,存储计算机指令,所述计算机指令用于在由电子设备的处理器执行时使所述电子设备执行操作,所述操作包括:
18.根据权利要求17所述的非暂时性计算机可读记录介质,其中,所述第一用户语音输入是用户发出第一语言的第一文本的语音的语音输入,并且
19.根据权利要求18所述的非暂时性计算机可读记录介质,其中,所述第一语言是韩语,所述第二语言是英语。
20.根据权利要求19所述的非暂时性计算机可读记录介质,其中,所述第一用户语音输入对应于所述电子设备的显示器上显示的文本,并且
技术总结公开了一种电子设备。所述电子设备包括:语音输入单元;存储单元,用于存储根据第一记录格式的第一文本和通过以第二记录格式记录第一文本而获得的至少一个第二文本;以及处理器,用于当从通过所述语音输入单元输入的用户语音转换得到的语音文本对应于预设指令时,执行根据该预设指令的功能。当预设指令包括第一文本,并且语音文本是预设指令的第一文本被记录为第二记录格式的第二文本后的文本时,处理器执行根据预设指令的功能。技术研发人员:权哉成受保护的技术使用者:三星电子株式会社技术研发日:技术公布日:2024/5/8本文地址:https://www.jishuxx.com/zhuanli/20240618/23866.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表