技术新讯 > 乐器声学设备的制造及制作,分析技术 > 助理应用的语音用户接口快捷方式的制作方法  >  正文

助理应用的语音用户接口快捷方式的制作方法

  • 国知局
  • 2024-06-21 11:27:37

背景技术:

1、人类可以与交互式软件应用进行人机对话,交互式软件应用在本文称为“自动化助理”(也称为“数字代理”、“聊天机器人”、“交互式个人助理”、“智能个人助理”、“会话代理”等)。例如,人类(当他们与自动化助理交互时可以被称为“用户”)可以通过使用口述自然语言输入(即,话语)提供命令来与自动化助理交互,在某些情况下,口述自然语言输入可以被转换成文本然后被处理,和/或通过提供文本(例如,键入的)自然语言输入。

2、通常,自动化助理预先配置有各种命令,当这些命令作为输入提供给自动化助理时,每个都使自动化助理执行相应的动作。然而,当提供了一个没有预先配置的命令时,自动化助理通常会失效(例如,呈现默认的错误消息,诸如“i don't know how to do that(我不知道如何做到那个)”。附加地或替选地,为了执行与多个命令相关联的动作,自动化助理通常需要对多个命令中的每一个的分立输入。例如,为了使自动化助理打开联网灯并播放音乐,用户必须提供两个分立的输入,诸如“turn on the lights(开灯)”的第一输入和“play music(播放音乐)”的第二输入。此外,响应于一些命令,一些自动化助理将总是与用户进行进一步的对话,以解析执行相应动作所需的一个或多个槽的一个或多个值。例如,响应于“turn on the lights”,自动化助理可以总是提示用户“please specify whichlights(请指定哪些灯)”来解析相应动作的“一个或多个灯识别”槽的值。

技术实现思路

1、本公开涉及用于为自动化助理应用生成和/或利用快捷命令的系统、方法和装置。在一些实施方式中,用户通过自动化助理接口与自动化助理交互,以提供一个或多个预先配置的命令短语的快捷命令短语。自动化助理可以生成存储条目,该存储条目将所提供的快捷命令短语与预先配置的命令短语和/或与预先配置的命令短语相对应的(一个或多个)动作相关联。

2、作为一个示例,假设自动化助理被预先配置为响应命令短语“set my alarm(设置我的警报)”和“turn off the lights(关灯)”。进一步假设助理没有被预先配置为响应于命令短语“nighty night(晚安)”。如果用户经由自动化助理接口提供“nighty night”的自然语言(例如,键入或口述)输入,则该输入(或其转换)可以被提供给助理应用,并由助理应用处理以确定其未被识别(即,没有映射到短语“nighty night”的特定动作)。代替响应于未识别短语仅呈现默认消息,诸如“i don'tknow how to do that(我不知道如何做到那个)”,自动化助理应用可以提示(例如,可听地和/或以图形方式)用户“教导”自动化助理响应于未识别短语要执行的一个或多个动作。例如,提示可以是“i don'tknow how torespond to that,but you can teach me.tell me what you'dlike me to do when yousay nighty night(我不知道对此如何回应,但你可以教我。告诉我你想让我在你说晚安的时候做什么)”。然后,用户可以提供进一步的自然语言输入“set my phone alarm clockand turn off the lights(设置我的手机闹钟并关灯)”。作为响应,自动化助理应用可以创建存储条目,该存储条目将短语“nighty night”(及其可选变体)映射到识别的命令短语“set my alarm clock(设置我的闹钟)”和“turn off the lights(关灯)”和/或与“set myphone alarm clock(设置我的电话闹钟)”相关联的动作和与“turn off the lights”相关联的动作。当用户此后提供短语“nighty night”时,自动化助理应用可以使与“set myphone alarm clock”和“turn off the lights”相关联的动作执行。在许多实施方式中,存储条目对于用户来说可以是个人的,这意味着这些动作将仅响应于从用户接收到“nightynight”(例如,在用户设备的自动化助理接口上,或者在“共享”设备上,并且在识别到用户的语音特征时)而响应于“nighty night”来执行。

3、以这些和其他方式,可以通过扩展自动化助理响应的命令短语来实现改进的自动化助理。此外,以这些和其他方式,可以减少网络和/或计算资源。例如,快捷命令短语相对于原本执行相关联动作将需要的预先配置的命令短语可以是简短的。例如,当“nightynight”被配置为命令短语后被说出时,传输语音数据比说出“set my phone alarmclock”和“turn off the lights”两者时传输语音数据消耗更少的带宽。此外,可以减少语音数据的语音到文本处理和/或其他处理中的计算负担。

4、在一些实施方式中,映射到快捷命令短语的动作可以具有一个或多个槽,这些槽的值需要在动作可以由自动化助理应用执行之前被解析。例如,与“set phone alarmclock”相关联的动作可以具有用于“闹钟时间”的槽,其值需要在动作可以被执行之前被解析。在这些实施方式中的一些中,当快捷命令短语被配置时,自动化助理应用可以提示用户为(一个或多个)该槽定义(一个或多个)槽值,并且可选地,此后响应于接收到快捷命令短语,为利用(一个或多个)动作的(一个或多个)该槽值。继续上面的示例,当用户提供“setmy phone alarmclock and turn off the lights(设置我的手机闹钟并关灯)”时,自动化助理应用可以确定映射到“set my phone alarm clock”的动作对于“闹钟时间”槽具有未由“set my phone alarm clock and turn off the lights”指定的所需槽值。作为响应,自动化助理应用可以提供进一步的提示:“do you want to set a standard time forthe alarm,or have me prompt you each time you say nighty night?(你想为闹钟设置一个标准时间,还是让我在你每次说晚安时提示你?)”。如果用户以特定时间(例如,上午8:00)响应提示,则自动化助理应用此后可以响应于“nighty night”,将用户电话的闹钟设置为上午8:00,可选地不需要来自用户的任何确认。以这些和其他方式,可以通过将命令短语的快捷方式映射到动作,以及映射到这些动作的(一个或多个)槽的特定(一个或多个)槽值,来实现改进的自动化助理。此外,以这些和其他方式,响应于接收到快捷命令短语,(一个或多个)槽值可以被自动并入动作和/或动作可以被执行而不需要来自用户的任何进一步确认,这可以消除原本将需要以提供(一个或多个)槽值和/或确认动作的(一个或多个)对话回合。取消对话回合可以节省网络和计算资源。

5、在一些附加的和/或替选的实施方式中,可以响应于包括快捷命令短语和一个或多个预先配置的命令短语的单个话语来配置快捷命令短语。例如,假设自动化助理被预先配置为响应于命令短语“set my alarm(设置我的警报)”和“turn off the lights(关灯)”。进一步假设助理没有被预先配置为响应命令短语“nighty night”。如果用户经由自动化助理接口提供自然语言(如键入或口语)输入“when i say nighty night,set myphone alarm clock and turn off the lights.(当我说晚安时,设置手机闹钟并关灯。)”。作为响应,自动化助理应用可以创建存储条目,该条目将短语“nighty night”(及其可选变体)映射到命令短语“set my alarm”和“turn off the lights”和/或与“set myphone alarm clock”相关联的动作和与“turn off the lights”相关联的动作。当用户此后提供短语“nighty night”时,自动化助理应用可以使与“set my phone alarm clock”和“turn off the lights”相关联的动作执行。

6、以上描述是作为本公开的一些实施方式的概述而提供的。本文提供了对这些和其他实施方式的附加描述。

7、在一些实施方式中,由一个或多个处理器实施的方法被阐述为包括诸如在计算设备的自动化助理接口接收一个或多个命令短语的步骤。该一个或多个命令短语可以由计算设备可访问的自动化助理应用作为输入数据来处理。这些步骤还可以包括使用输入数据识别将由自动化助理应用执行的一个或多个动作,以及在自动化助理接口处接收快捷命令短语。快捷命令短语可以对应于响应于快捷命令短语由自动化助理应用执行一个或多个动作的请求。这些步骤还可以包括使得从自动化助理应用提供提示。该提示可以包括对一个或多个动作的动作槽值的请求。另外,这些步骤可以包括响应于该提示,接收用于实现该动作槽值的用户输入,并且生成提供快捷命令短语、槽值和一个或多个动作之间的相关性的存储条目。在生成存储条目之后,该方法可以包括响应于接收到快捷命令短语,在计算设备的自动化助理接口处接收快捷命令短语,并且基于提供快捷命令短语、槽值和一个或多个动作之间的相关性的存储条目:由自动化助理应用执行具有槽值的一个或多个动作。

8、在一些实施方式中,自动化助理接口是音频接口,并且一个或多个命令短语的每个命令短语对应于用户先前提供的多个口述命令之一。一个或多个命令短语中的至少一个命令短语可以使自动化助理应用向分立的计算设备传输代理命令,并且代理命令可以包括槽值。识别一个或多个命令短语的步骤可以包括将输入数据与自动化助理应用可访问的命令短语条目进行比较,以确定输入数据的一部分是否在命令短语条目中被识别。接收快捷命令短语的步骤可以包括接收多个快捷命令短语,并且该方法可以进一步包括识别多个快捷命令短语中快捷命令短语的总数,并且将快捷命令短语的总数与快捷阈值进行比较。该方法还可以包括,当快捷命令短语的总数在快捷阈值之外时,使自动化助理应用指示快捷命令短语的总数超过快捷阈值。

9、在其他实施方式中,系统被阐述为包括一个或多个处理器,以及被配置为存储指令的存储器,当指令被一个或多个处理器执行时,指令使得一个或多个处理器执行包括在助理接口处接收由用户提供的第一命令短语的步骤。助理接口可以与一个或多个处理器可访问的自动化助理应用相关联。这些步骤还可以包括至少基于第一命令短语与自动化助理应用可用的一个或多个命令短语之间相关性的缺乏来确定第一命令短语未被自动化助理应用识别。这些步骤还可以包括使得响应短语经由助理接口呈现给用户。响应短语可以包括对执行第一命令短语的指令的请求。另外,这些步骤可以包括响应于响应短语的提供而接收一个或多个第二命令短语。一个或多个第二命令短语可以响应于第一命令短语来识别将由自动化助理应用执行的一个或多个动作。此外,这些步骤可以包括使自动化助理应用与一个或多个第二命令短语中识别的一个或多个动作相关联地存储对应于第一命令短语的命令短语。这些步骤还可以包括,在使自动化助理应用与一个或多个第二命令短语中识别的一个或多个动作相关联地存储命令短语之后:在助理接口或附加助理接口处接收对应于命令短语的输入,并且响应于接收对应于命令短语的输入,并且基于与一个或多个动作相关联地存储的命令短语:使自动化助理应用执行一个或多个动作。

10、在一些实施方式中,一个或多个动作的动作包括通过向第三方代理应用传输调用请求,来调用托管在分立的计算设备上的第三方代理应用。这些步骤可以包括识别在第二命令短语之一中提供的槽值,并且将槽值并入到与命令短语相关联地存储的一个或多个动作的至少一个中。调用第三方代理应用可以包括将槽值并入到传输给第三方代理应用的调用请求中。基于与命令短语相关联地存储的一个或多个动作中并入的槽值,槽值可以被并入在调用请求中。响应于接收到对应于命令短语的输入,可以并入槽值,而不提示对槽值的任何确认。

11、在一些实施方式中,步骤可以包括在助理接口处接收第三命令短语。第三命令短语可以是对应于命令短语的口述命令。这些步骤还可以包括使第三命令短语被转换成由语音处理应用解析的输入数据,并且从输入数据确定在第三命令短语中识别到命令短语。该一个或多个动作可以包括将控制信号传输到一个或多个处理器可访问的外围设备。

12、在其他实施方式中,非暂时性计算机可读介质被配置为存储指令,当指令被一个或多个处理器执行时,使得一个或多个处理器执行包括以下步骤的步骤:在自动化助理应用的助理接口处接收命令短语。命令短语可以对应于由包括助理接口的计算设备的用户提供的口述命令。这些步骤还可以包括使自动化助理应用从命令短语中识别快捷命令短语和补充命令短语。补充命令短语可以是先前在助理接口处没有接收到的命令调用短语。这些步骤还可以包括使得生成存储条目,存储条目提供快捷命令短语与补充命令短语之间的对应关系;在生成存储条目之后,在助理接口处接收快捷命令短语;以及响应于接收到快捷命令短语,使自动化助理应用执行与补充命令短语相关联的一个或多个动作。助理接口可以是计算设备处的音频接口,并且一个或多个动作可以包括使得从计算设备提供听觉输出。在一些实施方式中,这些步骤可以包括使助理教学代理应用识别存储条目,并向自动化助理应用提供命令数据。命令数据可以识别补充命令短语。一个或多个动作可以包括向托管网站的远程服务器提供web查询。提供web查询的动作可以对应于补充命令短语。补充命令短语可以识别要包括在web查询中的槽值。使得生成存储条目可以包括调用助理教学代理,该助理教学代理将快捷命令短语选定为导致补充命令短语被提供给自动化助理应用的触发器。

13、此外,一些实施方式包括一个或多个计算设备的一个或多个处理器,其中一个或多个处理器可操作来执行存储在相关联的存储器中的指令,并且其中指令被配置成引起前述方法中任一方法的执行。一些实施方式还包括一个或多个非暂时性计算机可读存储介质,该存储介质存储可由一个或多个处理器执行以实现任何前述方法的计算机指令。

14、应该理解,本文更详细描述的前述概念和附加概念的所有组合都被认为是本公开的主题的一部分。例如,出现在本公开结尾的所要求保护的主题的所有组合被认为是本文公开的主题的一部分。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21656.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。