技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种用于IPA的语音处理方法和系统与流程 > 正文

一种用于IPA的语音处理方法和系统与流程

国知局
2024-06-21 11:50:58

本发明涉及智能交通领域，更具体地，涉及一种用于ipa的智能语音处理方法和系统。

背景技术：

1、近年来，随着智能车辆和舒适驾驶技术的发展，在车端通常会搭载智能个人助理(ipa)这一虚拟角色，驾驶者或乘客可以通过语音操控车辆，并且访问车辆功能和信息。目前ipa通常通过单个触发词/唤醒词来触发(例如，你好，xxx)，ipa在识别到触发词之后可以记录一段时间内的语音流，并且获得其中包含的控制命令，从而操控车辆进行对应操作(例如，打开空调、降下车窗等等)。

2、然而，目前的ipa仅基于唤醒词来分析环境声音，其仅能够在用户在唤醒词之后说出控制命令来进行对应操作，而无法例如从用户的对话中获取信息，从而无法真正理解用户的愿望或需求，这导致人车数字化交互不够。

3、因此，希望能够提供一种用于ipa的语音处理方法和系统，以使得ipa能够通过从用户的对话中获取信息并对这些信息进行分析来真正理解用户的愿望或意图，从而实现车辆与用户的更好的个性化交互，提高人车数字化互动体验。

技术实现思路

1、提供本技术实现要素：以便以简化形式介绍将在以下具体实施方式中进一步的描述一些概念。本发明内容并非旨在标识所要求保护的主题的关键特征或必要特征，也不旨在用于帮助确定所要求保护的主题的范围。

2、根据本发明的第一方面，提供了一种用于车辆的语音处理方法，所述方法包括：接收来自车内说话者的语音输入；从所述语音输入中识别与愿望或意图相关的触发词；在识别到所述触发词时，记录并保存所述触发词所在的预定义时间段内的语音片段；对所述语音片段进行识别和分析以提取出包含愿望或意图的信息；以及存储所述信息以供进一步访问。

3、本发明实施例的技术方案中，通过扩展与个人愿望或意图相关的可识别触发词(例如，假期、位置、品牌等)，并且通过记录并分析触发词相关对话的内容来真正理解用户的愿望或意图，从而例如在礼物推荐等场景下给出相关信息，进一步提高用户与汽车的个性化交互。

4、根据本发明的一个实施例，所述方法进一步包括：对所述语音输入进行声纹识别以确定所述说话者的身份；以及将所述包含愿望或意图的信息存储在与所述说话者相对应的用户简档中。

5、根据本发明的进一步实施例，所述方法进一步包括：在未识别到所述说话者的身份时，建立针对所述说话者的用户简档；以及将所述包含愿望或意图的信息存储在所建立的用户简档中。

6、根据本发明的进一步实施例，所述与愿望或意图相关的触发词包括以下类别中的一者或多者：品牌名称、假期、个人纪念日或地点。

7、根据本发明的进一步实施例，所述与愿望或意图相关的触发词是自定义设置的。

8、根据本发明的进一步实施例，所述预定义时间段是可调整的。

9、根据本发明的进一步实施例，所述方法进一步包括：在所述信息包含即时意图时，控制所述车辆执行与所述即时意图相对应的功能。

10、根据本发明的第二方面，提供了一种用于车辆的语音处理系统，所述系统包括：语音采集模块，所述语音采集模块被配置成接收来自车内说话者的语音输入；语音识别模块，所述语音识别模块被配置成从所述语音输入中识别与愿望或意图相关的触发词；语音分析模块，所述语音分析模块被配置成：在识别到所述触发词时，记录并保存所述触发词所在的预定义时间段内的语音片段；对所述语音片段进行识别和分析以提取出包含愿望或意图的信息；以及信息存储模块，所述信息存储模块被配置成存储所述信息以供进一步访问。

11、本发明实施例的技术方案中，通过利用ipa从用户对话/交谈中获取并分析得到相关信息，可以真正理解用户的愿望/意图，从而可以向用户提供更好的个性化服务，提高用户体验。

12、根据本发明的一个实施例，所述语音识别模块被进一步配置成对所述语音输入进行声纹识别以确定所述说话者的身份；并且所述信息存储模块被进一步配置成将所述包含愿望或意图的信息存储在与所述说话者相对应的用户简档中。

13、根据本发明的进一步实施例，所述信息存储模块被进一步配置成：在未识别到所述说话者的身份时，建立针对所述说话者的用户简档；以及将所述包含愿望或意图的信息存储在所建立的用户简档中。

14、根据本发明的进一步实施例，所述与愿望或意图相关的触发词包括以下类别中的一者或多者：品牌名称、假期、个人纪念日或地点。

15、根据本发明的进一步实施例，所述预定义时间段是可调整的。

16、根据本发明的进一步实施例，所述系统进一步包括：车辆控制模块，所述车辆控制模块被配置成在所述信息包含即时意图时，控制所述车辆执行与所述即时意图相对应的功能。

17、根据本发明的第三方面，提供了一种包括如前述方面中任一者的语音处理系统的车辆。

18、根据本发明的第四方面，提供了一种存储有指令的计算机可读存储介质，当所述指令被执行时使得机器执行如前述方面中任一者的方法。

19、通过阅读下面的详细描述并参考相关联的附图，这些及其他特点和优点将变得显而易见。应该理解，前面的概括说明和下面的详细描述只是说明性的，不会对所要求保护的各方面形成限制。

技术特征：

1.一种用于车辆的语音处理方法，所述方法包括：

2.如权利要求1所述的方法，其特征在于，进一步包括：

3.如权利要求2所述的方法，其特征在于，进一步包括：

4.如权利要求1所述的方法，其特征在于，所述与愿望或意图相关的触发词包括以下类别中的一者或多者：品牌名称、假期、个人纪念日或地点。

5.如权利要求1所述的方法，其特征在于，所述与愿望或意图相关的触发词是自定义设置的。

6.如权利要求1所述的方法，其特征在于，所述预定义时间段是可调整的。

7.如权利要求1所述的方法，其特征在于，进一步包括：

8.一种用于车辆的语音处理系统，所述系统包括：

9.如权利要求8所述的系统，其特征在于，

10.如权利要求9所述的系统，其特征在于，所述信息存储模块被进一步配置成：

11.如权利要求8所述的系统，其特征在于，所述与愿望或意图相关的触发词包括以下类别中的一者或多者：品牌名称、假期、个人纪念日或地点。

12.如权利要求8所述的系统，其特征在于，所述预定义时间段是可调整的。

13.如权利要求8所述的系统，其特征在于，进一步包括：

14.一种包括如权利要求8-13中任一项所述的语音处理系统的车辆。

15.一种存储有指令的计算机可读存储介质，当所述指令被执行时使得机器执行如权利要求1-7中任一项所述的方法。

技术总结本发明提供了一种用于车辆的语音处理方法和系统，方法包括：接收来自车内说话者的语音输入；从所述语音输入中识别与愿望或意图相关的触发词；在识别到所述触发词时，记录并保存所述触发词所在的预定义时间段内的语音片段；对所述语音片段进行分析以提取出包含愿望或意图的信息；以及存储所述信息以供进一步访问。另外，本发明还提供了一种支持智能语音处理功能的车辆。技术研发人员：M·布劳恩受保护的技术使用者：宝马股份公司技术研发日：技术公布日：2024/5/10