技术新讯 > 乐器声学设备的制造及制作,分析技术 > 本地化语音辨识助理的制作方法  >  正文

本地化语音辨识助理的制作方法

  • 国知局
  • 2024-06-21 11:33:01

本文公开的实施方案涉及数字助理,并且具体地涉及本地化语音辨识助理。

背景技术:

1、各种数字系统包括辅助用户执行任务的数字助理。例如,各种车辆包括数字助理,所述数字助理与诸如高级驾驶员辅助系统(adas)、信息娱乐系统、导航系统等子系统通信,以辅助车辆的用户。在一些车辆中,数字助理响应各种类型的用户输入以确定用户正在发起的特定命令。数字语音助理(dva)包括支持数字言语辨识和数字言语生成的工具,从而提供语音接口,所述语音接口使用户能够向数字语音助理提供会话输入作为用于命令采取特定动作的输入。所述接口使数字语音助理能够“侦听”来自用户的听觉言语输入,并以对应的动作做出响应。

2、然而,在车辆中使用数字语音助理的一个缺点是,此类数字语音助理需要连接到外部服务才能发挥作用。数字语音助理通过处理言语并将言语或言语的文本表示传输到后端数字助理服务来处理输入并确定对应的动作(例如,映射到特定意图的指示)来响应听觉言语输入。因此,当车辆未连接到数字后端服务时,数字语音助理无法响应用户的言语输入。其他常规的数字助理(诸如基于触摸的数字助理)具有有限的能力,因为常规的数字助理仅响应有限类型的用户输入,并且不响应由用户提供的言语输入。

3、如前所述,本领域需要用于与车辆操作相关联的数字语音助理的更有效的技术。

技术实现思路

1、各种实施方案公开了一种计算机实施的方法,所述计算机实施的方法包括:接收由用户生成的听觉言语信号;将听觉言语信号转换为文本段;将文本段与一组存储的意图进行比较,其中每个存储的意图指定车辆的部件要执行的一个或多个动作;以及在确定文本段对应于所述一组存储的意图中的第一意图时,检索与第一意图相关联的一个或多个动作,并且使车辆的一个或多个对应部件执行由所述一个或多个动作指定的动作。

2、所公开的技术相对于现有技术的至少一个技术优点在于,通过所公开的技术,用户可以有效地提供言语输入来使车辆部件执行命令,而无需外部服务处理言语输入,从而极大地提高了车辆用户的车载体验。具体地,通过处理用户的言语并执行一组车载命令,数字助理应用程序在车辆无法使用外部数字助理服务的情况下响应用户命令。此外,处理言语输入并执行车辆动作的子集使得车辆能够比将言语输入传输到外部服务进行处理更快地执行多个车载动作。此外,通过对数字助理应用程序无法在车内处理或执行的言语输入的表示进行排队,数字助理应用程序减轻了车辆用户的与必须重复言语输入一次或多次直到外部言语处理服务变得可用相关联的身体和精神压力。这些技术优点提供了优于现有技术方法的一个或多个技术进步。

技术特征:

1.一种计算机实施的方法,其包括:

2.根据权利要求1所述的计算机实施的方法,其中所述文本段指定所述车辆外部的装置要执行的至少一个动作。

3.根据权利要求2所述的计算机实施的方法,其还包括:

4.根据权利要求3所述的计算机实施的方法,其还包括:

5.根据权利要求3所述的计算机实施的方法,其中所述远程服务包括后端数字助理服务、事件驱动的架构或车辆服务平台中的至少一者。

6.根据权利要求2所述的计算机实施的方法,其还包括:

7.根据权利要求1所述的计算机实施的方法,其中使所述车辆的一个或多个对应部件执行由所述一个或多个动作指定的动作包括:

8.根据权利要求1所述的计算机实施的方法,其还包括:

9.根据权利要求1所述的计算机实施的方法,其中所述一个或多个动作中的每个动作标识以下各者中的至少一者:

10.一种或多种非暂时性计算机可读介质,其存储指令,所述指令在由一个或多个处理器执行时使所述一个或多个处理器执行以下步骤:

11.根据权利要求10所述的一种或多种非暂时性计算机可读介质,其中所述文本段指定所述车辆外部的装置要执行的至少一个动作。

12.根据权利要求10所述的一种或多种非暂时性计算机可读介质,所述步骤还包括:

13.根据权利要求12所述的一种或多种非暂时性计算机可读介质,所述步骤还包括:

14.一种系统,其包括:

15.根据权利要求14所述的系统,其中所述文本段指定所述车辆外部的装置要执行的至少一个动作。

16.根据权利要求15所述的系统,其中所述车辆外部的所述装置包括可穿戴装置、传感器装置、物联网(iot)装置或远程计算装置中的一者。

17.根据权利要求14所述的系统,所述步骤还包括:

18.根据权利要求17所述的系统,所述步骤还包括:

19.根据权利要求14所述的系统,其中所述一个或多个对应部件包括娱乐子系统、导航子系统、高级驾驶员辅助系统(adas)或气候控制子系统中的至少一者。

20.根据权利要求14所述的系统,其中使所述一个或多个对应部件执行由所述一个或多个动作指定的动作包括向部件控制器应用程序发送指令,其中所述部件控制器应用程序:

技术总结本公开涉及本地化语音辨识助理。各种实施方案公开了一种计算机实施的方法,所述计算机实施的方法包括:接收由用户生成的听觉言语信号;将听觉言语信号转换为文本段;将文本段与一组存储的意图进行比较,其中每个存储的意图指定车辆的部件要执行的一个或多个动作;以及在确定文本段对应于所述一组存储的意图中的第一意图时,检索与第一意图相关联的一个或多个动作,并且使车辆的一个或多个对应部件执行由所述一个或多个动作指定的动作。技术研发人员:S·P·萨胡受保护的技术使用者:哈曼国际工业有限公司技术研发日:技术公布日:2024/3/11

本文地址:https://www.jishuxx.com/zhuanli/20240618/22181.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。