语音信息的分类方法、装置、存储介质和电子设备与流程
- 国知局
- 2024-06-21 11:35:33
本申请涉及人工智能领域,具体而言,涉及一种语音信息的分类方法、装置、存储介质和电子设备。
背景技术:
1、目前,随着互联网的飞速发展,语音识别技术作为人工智能领域的一个重要分支,在过去几十年里取得了令人瞩目的成就,但随着地域文化的传承,产生了众多的方言种类,且每个方言都有其独特的语音、词汇和语法特点,进而导致出现语音信息的分类准确率低的技术问题。
2、针对上述语音信息的分类准确率低的技术问题,目前尚未提出有效的解决方案。
技术实现思路
1、本申请实施例提供了一种语音信息的分类方法、装置、存储介质和电子设备,以至少解决语音信息的分类准确率低的技术问题。
2、根据本申请实施例的一个方面,提供了一种语音信息的分类方法。该方法可以包括:获取目标语音信息的编码结果和语音特征,其中,编码结果为对目标语音信息进行编码得到;对编码结果和语音特征进行融合处理,得到融合结果;基于融合结果,对目标语音信息进行分类,得到目标分类结果,其中,目标分类结果用于表示目标语音信息所属的语音类型。
3、可选地,获取目标语音信息的编码结果,包括:对目标语音信息进行特征映射,得到编码结果。
4、可选地,获取目标语音信息的语音特征,包括:确定目标语音信息的约束信息,其中,约束信息用于对目标分类结果进行约束;基于约束信息,得到语音特征。
5、可选地,确定目标语音信息的约束信息,包括:确定第一约束信息和第二约束信息,其中,第一约束信息用于对普通话的语音特征进行约束,第二约束信息用于对方言的语音特征进行约束;基于第一约束信息和第二约束信息,确定约束信息。
6、可选地,基于第一约束信息和第二约束信息,确定约束信息,包括:将第一约束信息与第二约束信息进行求和运算,得到约束信息。
7、可选地,基于约束信息,得到语音特征,包括:基于约束信息,设置激活函数,其中,激活函数用于对目标语音信息进行非线性处理;基于激活函数,得到语音特征。
8、可选地,基于融合结果,对目标语音信息进行分类,得到目标分类结果,包括:将融合结果输入至语言模型进行分类,得到目标分类结果,其中,语言模型用于对不同的输入语音信息进行分类。
9、根据本申请实施例的另一方面,还提供了一种语音信息的分类装置,包括:第一获取单元,用于获取目标语音信息的编码结果和语音特征,其中,编码结果为对目标语音信息进行编码得到;第二获取单元,用于对编码结果和语音特征进行融合处理,得到融合结果;第三获取单元,用于基于融合结果,对目标语音信息进行分类,得到目标分类结果,其中,目标分类结果用于表示目标语音信息所属的语音类型。
10、根据本申请实施例的另一方面,还提供了一种非易失性存储介质,包括:存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行任意一种语音信息的分类方法。
11、根据本申请实施例的另一方面,还提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现任意一种语音信息的分类方法。
12、在本申请实施例中,先获取目标语音信息的编码结果和语音特征,然后将编码结果和语音特征进行融合处理,得到融合结果,最后根据获得的融合结果,对目标语音信息进行分类,以达到获取用于表示目标语音信息所属的语音类型的目标分类结果的目的。由于考虑到将获取到的目标语音信息的编码结果和语音特征进行融合处理,以便获取目标语音信息的目标分类结果,进而解决了语音信息的分类准确率低的技术问题,实现了提高语音信息的分类准确率的技术效果。
技术特征:1.一种语音信息的分类方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,获取目标语音信息的编码结果,包括:
3.根据权利要求1所述的方法,其特征在于,获取目标语音信息的语音特征,包括:
4.根据权利要求3所述的方法,其特征在于,确定所述目标语音信息的约束信息,包括:
5.根据权利要求4所述的方法,其特征在于,基于所述第一约束信息和所述第二约束信息,确定所述约束信息,包括:
6.根据权利要求3所述的方法,其特征在于,基于所述约束信息,得到所述语音特征,包括:
7.根据权利要求1所述的方法,其特征在于,基于所述融合结果,对所述目标语音信息进行分类,得到目标分类结果,包括:
8.一种语音信息的分类装置,其特征在于,包括:
9.一种非易失性存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述的语音信息的分类方法。
10.一种电子设备,其特征在于,包括:
技术总结本申请公开了一种语音信息的分类方法、装置、存储介质和电子设备。其中,该方法包括:获取目标语音信息的编码结果和语音特征,其中,编码结果为对目标语音信息进行编码得到;对编码结果和语音特征进行融合处理,得到融合结果;基于融合结果,对目标语音信息进行分类,得到目标分类结果,其中,目标分类结果用于表示目标语音信息所属的语音类型。本申请解决了语音信息的分类准确率低的技术问题。技术研发人员:夏光敏,康健,李杰受保护的技术使用者:中国电信股份有限公司技术研发日:技术公布日:2024/3/12本文地址:https://www.jishuxx.com/zhuanli/20240618/22289.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。