技术新讯 > 乐器声学设备的制造及制作,分析技术 > 基于AI的语音情绪识别模型的训练方法与流程  >  正文

基于AI的语音情绪识别模型的训练方法与流程

  • 国知局
  • 2024-06-21 11:26:53

本发明涉及情绪识别,尤其涉及一种基于ai的语音情绪识别模型的训练方法。

背景技术:

1、语音是人类交流中情感的重要载体。语音识别主要关注说话者说了什么。情绪识别主要关注说话者是在什么情绪下说的。人们在不同情绪状态下的语言表达方式会有所不同,例如高兴时说话的语调会比较欢快,而烦躁伤心时语气比较沉闷。深度学习技术加速了从语音中检测情绪的进展。

2、现今,语音情绪识别模型广泛应用于客服领域,用于帮助ai客服判断用于情绪,进而判断是否转入人工客服或进入后续客服服务,在现有技术中,应用于ai客服层面上的语音情绪识别模型大多采用统一固定的语音情绪识别模型,导致在面对不同用户时,会因为用户语种、语言特征等问题导致统一固定的语音情绪识别模型无法做到精确的情绪识别,因此语音情绪识别的准确率不高;本发明提供一种基基于ai的语音情绪识别模型的训练方法,采用逐步获取优化模型参数的方式,对统一固定的语音情绪识别模型进行模型更新,生成不同用户的独立语音情绪识别模型,提高语音情绪识别的准确率。

技术实现思路

1、针对现有技术的不足,本发明提供一种基于ai的语音情绪识别模型的训练方法,用于解决上述问题。

2、一种基于ai的语音情绪识别模型的训练方法,包括:获取来电用户信息,根据来电用户信息建立来电用户的来电特征;

3、根据来电特征对预设数据库进行筛选,匹配得到基于深度学习暨神经网络的语音情绪识别模型,其中,来电特征和语音情绪识别模型一一对应;

4、获取来电用户信息中包含的用户语音信息,输入用户语音信息至语音情绪识别模型,得到识别结果;

5、获取当前用户语音信息对应的语音情绪标签,根据识别结果和语音情绪标签,对当前来电用户的语音情绪识别模型的模型参数进行更新,得到新的语音情绪识别模型。

6、作为本发明的一种实施例,获取新的语音情绪识别模型,替换预设数据库中与当前来电用户对应的语音情绪识别模型。

7、作为本发明的一种实施例,来电用户信息包括来电归属地信息、来电号码信息以及来电人员的用户语音信息。

8、作为本发明的一种实施例,获取来电用户信息,根据来电用户信息建立来电用户的来电特征,包括:

9、获取来电用户信息,记录来电归属地信息和来电号码信息,确定来电用户的来电归属地特征和来电号码特征;

10、提取用户语音信息中的用户语音特征,构建来电人员信息特征,其中,来电人员信息特征包括性别特征和年龄范围特征。

11、作为本发明的一种实施例,根据来电特征对预设数据库进行筛选,匹配得到基于深度学习暨神经网络的语音情绪识别模型,包括:

12、获取来电归属地特征,根据来电归属地特征对预设数据库中的所有语音情绪识别模型进行第一次验证,得到第一验证结果;

13、获取来电号码特征,根据来电号码特征对符合第一验证结果的所有语音情绪识别模型进行第二次验证,得到目标语音情绪识别模型;

14、获取来电人员信息特征,根据来电人员信息特征对目标语音情绪识别模型进行第三次验证,得到第三验证结果;其中,第三验证结果用于表征来电用户与目标语音情绪识别模型是否匹配。

15、作为本发明的一种实施例,一种基于ai的语音情绪识别模型的训练方法还包括:若第三验证结果为来电用户与目标语音情绪识别模型不匹配,生成临时语音情绪识别模型用于当前来电用户的情绪识别;其中,当前来电用户的识别结果不参与目标语音情绪识别模型的模型参数更新。

16、作为本发明的一种实施例,预设数据库中包括若干地区分类数据库,每一地区分类数据库中存储有若干带有同一来电归属地特征标记的语音情绪识别模型。

17、作为本发明的一种实施例,获取来电号码特征,根据来电号码特征对符合第一验证结果的所有语音情绪识别模型进行第二次验证,得到目标语音情绪识别模型,包括:

18、获取符合第一验证结果的地区分类数据库,根据来电号码特征对地区分类数据库进行筛选,得到目标语音情绪识别模型;其中,目标语音情绪识别模型为地区分类数据库中带有同一来电号码特征标记的语音情绪识别模型。

19、作为本发明的一种实施例,获取来电人员信息特征,根据来电人员信息特征对目标语音情绪识别模型进行第三次验证,得到第三验证结果,包括:

20、获取目标语音情绪识别模型携带的目标用户人员信息特征和电人员信息特征,根据来电人员信息特征对目标语音情绪识别模型进行第三次验证,得到第三验证结果;其中,第三次验证为比较目标用户人员信息特征与来电人员信息特征的特征相似度;

21、若第三次验证结果为特征相似度大于预设特征相似度,判定来电用户与目标语音情绪识别模型匹配,对本次来电用户与目标语音情绪识别模型进行关联;

22、若第三次验证结果为特征相似度不大于预设特征相似度,判定来电用户与目标语音情绪识别模型不匹配,对本次来电用户与预设初始语音情绪识别模型进行关联。

23、作为本发明的一种实施例,获取来电用户信息中包含的用户语音信息,输入用户语音信息至语音情绪识别模型,得到识别结果,包括:

24、基于梅尔频率倒谱系数,对用户语音信息进行声纹特征提取,得到语音特征;

25、基于预先训练好的语种识别模型,以用户语音信息为输入,输出得到用户语音信息对应的语种信息,根据语种信息确定第一语言特征;

26、基于第一语言特征,获取相应的语种文本识别模型对用户语音信息进行文本识别,得到文本信息;提取文本信息中带有情感语义的词语信息,确定第二语言特征;

27、输入语音特征、第一语言特征和第二语言特征至语音情绪识别模型,得到识别结果。

28、本发明的有益效果为:

29、本发明提供一种基基于ai的语音情绪识别模型的训练方法,采用逐步获取优化模型参数的方式,对统一固定的语音情绪识别模型进行模型更新,生成不同用户的独立语音情绪识别模型,提高语音情绪识别的准确率。

30、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

31、下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

技术特征:

1.一种基于ai的语音情绪识别模型的训练方法,其特征在于,包括:

2.根据权利要求1所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,还包括:获取新的语音情绪识别模型,替换预设数据库中与当前来电用户对应的语音情绪识别模型。

3.根据权利要求1所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,来电用户信息包括来电归属地信息、来电号码信息以及来电人员的用户语音信息。

4.根据权利要求1所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,获取来电用户信息,根据来电用户信息建立来电用户的来电特征,包括:

5.根据权利要求1所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,根据来电特征对预设数据库进行筛选,匹配得到基于深度学习暨神经网络的语音情绪识别模型,包括:

6.根据权利要求5所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,还包括:若第三验证结果为来电用户与目标语音情绪识别模型不匹配,生成临时语音情绪识别模型用于当前来电用户的情绪识别;其中,当前来电用户的识别结果不参与目标语音情绪识别模型的模型参数更新。

7.根据权利要求5所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,预设数据库中包括若干地区分类数据库,每一地区分类数据库中存储有若干带有同一来电归属地特征标记的语音情绪识别模型。

8.根据权利要求5所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,获取来电号码特征,根据来电号码特征对符合第一验证结果的所有语音情绪识别模型进行第二次验证,得到目标语音情绪识别模型,包括:

9.根据权利要求5所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,获取来电人员信息特征,根据来电人员信息特征对目标语音情绪识别模型进行第三次验证,得到第三验证结果,包括:

10.根据权利要求1所述的一种基于ai的语音情绪识别模型的训练方法,其特征在于,获取来电用户信息中包含的用户语音信息,输入用户语音信息至语音情绪识别模型,得到识别结果,包括:

技术总结本发明提供了一种基于AI的语音情绪识别模型的训练方法,包括:获取来电用户信息,根据来电用户信息建立来电用户的来电特征;根据来电特征对预设数据库进行筛选,匹配得到基于深度学习暨神经网络的语音情绪识别模型,其中,来电特征和语音情绪识别模型一一对应;获取来电用户信息中包含的用户语音信息,输入用户语音信息至语音情绪识别模型,得到识别结果;获取当前用户语音信息对应的语音情绪标签,根据识别结果和语音情绪标签,对当前来电用户的语音情绪识别模型的模型参数进行更新,得到新的语音情绪识别模型。技术研发人员:王沛,谭穗,王敏乐,张庆受保护的技术使用者:广州易风健康科技股份有限公司技术研发日:技术公布日:2024/2/8

本文地址:https://www.jishuxx.com/zhuanli/20240618/21580.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。