技术新讯 > 乐器声学设备的制造及制作,分析技术 > 长语音情感智能识别方法、系统及计算机可读存储介质 > 正文

长语音情感智能识别方法、系统及计算机可读存储介质

国知局
2024-06-21 11:53:54

本发明涉及计算机数据处理，特别涉及长语音情感智能识别方法、系统及计算机可读存储介质。

背景技术：

1、人机对话技术日趋发展、成熟。但是，目前的人机对话仅局限于计算机分析用户发言的语义，并做出适应回复，计算机无法得知用户的情感，使得智能化的上升空间仍较大，用户体验感不足。

技术实现思路

1、本发明目的之一在于提供了长语音情感智能识别方法，对用户发言的表达情感进行智能化识别，提升了人机交互的智能化程度，更增加了用户体验。

2、本发明实施例提供的长语音情感智能识别方法，包括：

3、获取用户的人声长语音；

4、提取所述人声长语音的特征集；

5、基于所述特征集、预设的情感识别库，确定用户的表达情感。

6、优选的，所述获取用户的人声长语音，包括：

7、获取用户的多模态数据；

8、当所述多模态数据符合预设的获取触发条件库中的至少一个获取触发条件时，获取用户的人声长语音。

9、优选的，所述提取所述人声长语音的特征集，包括：

10、基于预设的分段间隔，对所述人声长语音进行分段，获得人声序列；所述人声序列中前n-1个分段语音的语音长度等于所述分段间隔，第n个分段语音的语音长度小于等于所述分段间隔；n为人声序列中分段语音的总数目；

11、基于特征提取规则，提取所述人声序列的所述特征集；

12、其中，所述特征提取规则包括：

13、基于预设的第一特征提取模板，按照分段语音在所述人声序列中的排列先后顺序依次对分段语音进行特征提取；

14、和/或，

15、当对所述人声序列中第i个分段语音进行特征提取时，若提取出的语音特征在预设的后续特征提取指示库中对应有第二补充特征提取模板、第一指示类型，基于所述第二补充特征提取模板，对所述人声序列中第i个分段语音、第i+1个分段语音进行补充特征提取；1≤i≤n；

16、和/或，

17、当对所述人声序列中第i个分段语音进行特征提取时，若提取出的语音特征在预设的后续特征提取指示库中对应有第三补充特征提取模板、第二指示类型，基于所述第三补充特征提取模板，对所述人声序列中第i+j个分段语音进行补充特征提取；1≤j≤n-i。

18、优选的，所述基于所述特征集、预设的情感识别库，确定用户的表达情感，包括：

19、构建所述特征集的描述向量；

20、从所述情感识别库中确定多个目标情感识别结果；所述目标情感识别结果对应的预设的标准描述向量与所述描述向量之间的向量相似度大于等于预设的相似度阈值；

21、基于所述多个目标情感识别结果，确定所述表达情感；

22、和/或，

23、基于预设的搜索式生成模板，根据所述特征集，确定识别知识搜索式；

24、基于所述识别知识搜索式，从所述情感识别库中搜索出识别知识；

25、基于所述识别知识，确定所述表达情感。

26、本发明实施例提供的长语音情感智能识别系统，包括：

27、获取模块，用于获取用户的人声长语音；

28、提取模块，用于提取所述人声长语音的特征集；

29、识别模块，用于基于所述特征集、预设的情感识别库，确定用户的表达情感。

30、优选的，所述获取模块获取用户的人声长语音，包括：

31、获取用户的多模态数据；

32、当所述多模态数据符合预设的获取触发条件库中的至少一个获取触发条件时，获取用户的人声长语音。

33、优选的，所述提取模块提取所述人声长语音的特征集，包括：

34、基于预设的分段间隔，对所述人声长语音进行分段，获得人声序列；所述人声序列中前n-1个分段语音的语音长度等于所述分段间隔，第n个分段语音的语音长度小于等于所述分段间隔；n为人声序列中分段语音的总数目；

35、基于特征提取规则，提取所述人声序列的所述特征集；

36、其中，所述特征提取规则包括：

37、基于预设的第一特征提取模板，按照分段语音在所述人声序列中的排列先后顺序依次对分段语音进行特征提取；

38、和/或，

39、当对所述人声序列中第i个分段语音进行特征提取时，若提取出的语音特征在预设的后续特征提取指示库中对应有第二补充特征提取模板、第一指示类型，基于所述第二补充特征提取模板，对所述人声序列中第i个分段语音、第i+1个分段语音进行补充特征提取；1≤i≤n；

40、和/或，

41、当对所述人声序列中第i个分段语音进行特征提取时，若提取出的语音特征在预设的后续特征提取指示库中对应有第三补充特征提取模板、第二指示类型，基于所述第三补充特征提取模板，对所述人声序列中第i+j个分段语音进行补充特征提取；1≤j≤n-i。

42、优选的，所述识别模块基于所述特征集、预设的情感识别库，确定用户的表达情感，包括：

43、构建所述特征集的描述向量；

44、从所述情感识别库中确定多个目标情感识别结果；所述目标情感识别结果对应的预设的标准描述向量与所述描述向量之间的向量相似度大于等于预设的相似度阈值；

45、基于所述多个目标情感识别结果，确定所述表达情感；

46、和/或，

47、基于预设的搜索式生成模板，根据所述特征集，确定识别知识搜索式；

48、基于所述识别知识搜索式，从所述情感识别库中搜索出识别知识；

49、基于所述识别知识，确定所述表达情感。

50、本发明实施例提供的一种计算机可读存储介质，存储有计算机程序代码，计算机程序代码在由处理器执行时实现上述任一项所述的长语音情感智能识别方法。

51、本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

52、下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

技术特征：

1.长语音情感智能识别方法，其特征在于，包括：

2.如权利要求1所述的长语音情感智能识别方法，其特征在于，所述获取用户的人声长语音，包括：

3.长语音情感智能识别系统，其特征在于，包括：

4.如权利要求3所述的长语音情感智能识别系统，其特征在于，所述获取模块获取用户的人声长语音，包括：

5.一种计算机可读存储介质，其特征在于，存储有计算机程序代码，计算机程序代码在由处理器执行时实现如权利要求1-2任一项所述的长语音情感智能识别方法。

技术总结本发明提供长语音情感智能识别方法、系统及计算机可读存储介质，其中方法包括：获取用户的人声长语音；提取所述人声长语音的特征集；基于所述特征集、预设的情感识别库，确定用户的表达情感。本发明的长语音情感智能识别方法、系统及计算机可读存储介质，对用户发言的表达情感进行智能化识别，提升了人机交互的智能化程度，更增加了用户体验。技术研发人员：孙久,柏阳,蔡书存,杨乾辂,岳凌霄,张胜芳受保护的技术使用者：盐城工学院技术研发日：技术公布日：2024/5/29