技术新讯 > 乐器声学设备的制造及制作,分析技术 > 车辆用角色化语音模型选取方法、语音交互方法及装置与流程 > 正文

车辆用角色化语音模型选取方法、语音交互方法及装置与流程

国知局
2024-06-21 11:53:13

本申请涉及车辆人机交互，尤其涉及一种车辆用角色化语音模型选取方法、车辆用角色化语音模型选取装置、车辆用角色化语音交互方法、车辆用角色化语音交互装置。

背景技术：

1、当前车载智能语音助理的音色、风格、播报内容均为预置，由厂商提前选择好一个声音和人设，结合这个人设来设计与用户交互时的播报内容。这样的智能语音助理无法满足用户个性化的需求，也无法达到趣味化的交互体验。在非车载领域，如短视频ugc平台中，市场上已经有一些被广泛使用的、模仿影视剧角色风格来进行播报的配音音色，为声音上的多样化提供了可能性，但是作为风格体现的重要部分，文本内容却需要用户自己输入进去，这在车载语音交互的场景中是不可行的。无法在大量扩充多样的音色的同时，能有匹配音色的语言表达，是当前车载智能语音助手个性化、趣味化的瓶颈。

2、因此，希望有一种技术方案来解决或至少减轻现有技术的上述不足。

技术实现思路

1、本发明的目的在于提供一种车辆用角色化语音模型选取方法来至少解决上述的一个技术问题。

2、本发明提供了下述方案：

3、根据本发明的一个方面，提供一种车辆用角色化语音模型选取方法，所述车辆用角色化语音模型选取方法包括：

4、获取待使用角色信息；

5、根据待使用角色信息获取经过训练的最终待使用角色化语音模型。

6、可选地，所述根据待使用角色信息获取经过训练的待使用角色化语音模型包括：

7、获取待使用角色化语音模型数据库，所述待使用角色化语音模型数据库包括至少一个特征池以及每个特征池对应的待使用角色化语音模型组，每个待使用角色化语音模型组中包括至少一个经过训练的待使用角色化语音模型；

8、提取所述待使用角色信息中的角色特征；

9、将所述角色特征分别与每个特征池进行匹配，从而获取匹配成功的特征池所对应的待使用角色化语音模型组；

10、自所述待使用角色化语音模型组中获取一个待使用角色化语音模型作为最终待使用角色化语音模型。

11、可选地，每个所述特征池包括至少一个预设特征；

12、所述将所述角色特征分别与每个特征池进行匹配，从而获取匹配成功的特征池所对应的待使用角色化语音模型组包括：

13、为每个角色特征进行如下处理：

14、将角色特征与每个特征池中的每个预设特征均进行相似度计算；

15、判断是否有一个相似度超过第一预设相似度阈值，若是，则

16、为与角色特征的相似度超过第一预设相似度阈值的预设特征所对应的特征池生成一个角色特征分值；

17、获取每个特征池的角色特征分值之和作为最终分值；

18、判断最终分值最高的一个特征池所对应的特征池的最终分值是否超过第一预设分值阈值，若是，则

19、判断最终分值超过第一预设分值阈值的特征池与所述角色特征匹配成功。

20、可选地，所述角色特征为文字信息；

21、所述为与角色特征的相似度超过第一预设相似度阈值的预设特征所对应的特征池生成一个角色特征分值包括：

22、获取角色特征的词性；

23、获取词性分值库，所述词性分值库包括至少一个预设词性以及每个词性所对应的分值；

24、获取与所述角色特征的词性相同的预设词性所对应的分值作为所述角色特征分值。

25、可选地，每个所述待使用角色化语音模型组均包括至少一个待使用角色化语音模型；

26、当获取匹配成功的特征池所对应的待使用角色化语音模型组中的待使用角色化语音模型的数量为两个以上时，所述自所述待使用角色化语音模型组中获取一个待使用角色化语音模型作为最终待使用角色化语音模型包括：

27、获取待使用风格信息；

28、获取风格数据库，每个所述风格数据库包括至少一个预设风格以及每个预设风格所对应的待使用角色化语音模型，其中，一个待使用角色化语音模型组关联一个风格数据库；

29、获取匹配成功的特征池所对应的待使用角色化语音模型组所对应的风格数据库作为待匹配风格数据库；

30、将待使用风格信息与所述待匹配风格数据库中的各个预设风格进行匹配，获取匹配成功的预设风格所对应的待使用角色化语音模型作为最终待使用角色化语音模型。

31、可选地，每个所述待使用角色化语音模型均包括一个经过训练的文本预测神经网络以及一个经过训练的语音合成模型。

32、本申请还提供了一种车辆用角色化语音模型选取装置，所述车辆用角色化语音模型选取装置包括：

33、待使用角色信息获取模块，所述待使用角色信息获取模块用于获取待使用角色信息；

34、最终待使用角色化语音模型获取模块，所述最终待使用角色化语音模型获取模块用于根据待使用角色信息获取经过训练的最终待使用角色化语音模型。

35、本申请还提供了一种车辆用角色化语音交互方法，所述车辆用角色化语音交互方法包括：

36、获取车内人员的语音信息；

37、识别所述语音信息，从而通过语音信息判断是否需要进行车辆用角色化语音模型选择，若是，则

38、采用如上所述的车辆用角色化语音模型选取方法选取最终待使用角色化语音模型。

39、可选地，所述车辆用角色化语音交互方法进一步包括：

40、获取车内人员的交互语音信息；

41、提取所述车内人员的交互语音信息中的语音特征；

42、将所述语音特征输入至所述最终待使用角色化语音模型，从而获取用于对所述交互语音信息进行反馈的反馈信息并发送给车载娱乐主机进行语音播报。

43、本申请还提供了一种车辆用角色化语音交互装置，所述车辆用角色化语音交互装置包括：

44、语音信息获取模块，所述语音信息获取模块用于获取车内人员的语音信息；

45、语音信息识别判断模块，所述语音信息识别判断模块用于识别所述语音信息，从而通过语音信息判断是否需要进行车辆用角色化语音模型选择；

46、车辆用角色化语音模型选取装置，所述车辆用角色化语音模型选取装置用于在所述语音信息识别判断模块判断为是时采用如上所述的车辆用角色化语音模型选取方法选取最终待使用角色化语音模型。

47、本申请的车辆用角色化语音模型选取方法可以让车内人员快速的选择喜欢的角色化语音模型，通过与角色化语音模型进行交互，能够获取到该角色化语音模型的个性语音内容。

技术特征：

1.一种车辆用角色化语音模型选取方法，其特征在于，所述车辆用角色化语音模型选取方法包括：

2.如权利要求1所述的车辆用角色化语音模型选取方法，其特征在于，所述根据待使用角色信息获取经过训练的待使用角色化语音模型包括：

3.如权利要求2所述的车辆用角色化语音模型选取方法，其特征在于，每个所述特征池包括至少一个预设特征；

4.如权利要求3所述的车辆用角色化语音模型选取方法，其特征在于，所述角色特征为文字信息；

5.如权利要求4所述的车辆用角色化语音模型选取方法，其特征在于，

6.如权利要求5所述的车辆用角色化语音模型选取方法，其特征在于，每个所述待使用角色化语音模型均包括一个经过训练的文本预测神经网络以及一个经过训练的语音合成模型。

7.一种车辆用角色化语音模型选取装置，其特征在于，所述车辆用角色化语音模型选取装置包括：

8.一种车辆用角色化语音交互方法，其特征在于，所述车辆用角色化语音交互方法包括：

9.如权利要求8所述的车辆用角色化语音交互方法，其特征在于，所述车辆用角色化语音交互方法进一步包括：

10.一种车辆用角色化语音交互装置，其特征在于，所述车辆用角色化语音交互装置包括：

技术总结本申请公开了一种车辆用角色化语音模型选取方法、语音交互方法及装置。所述车辆用角色化语音模型选取方法包括：获取待使用角色信息；根据待使用角色信息获取经过训练的最终待使用角色化语音模型。本申请的车辆用角色化语音模型选取方法可以让车内人员快速的选择喜欢的角色化语音模型，通过与角色化语音模型进行交互，能够获取到该角色化语音模型的个性语音内容。技术研发人员：李靖怡,陈彩可,闫明毅,李龙飞,张文权,张炜玮,林孟超,葛温清受保护的技术使用者：中国第一汽车股份有限公司技术研发日：技术公布日：2024/5/27