基于数据预测的语音识别方法及系统与流程
- 国知局
- 2024-06-21 11:45:54
本发明涉及语音识别,尤其涉及一种基于数据预测的语音识别方法及系统。
背景技术:
1、随着语音识别技术的发展,越来越多场景开始应用语音识别技术来提高交互的效果,语音识别的数据量和难度也越来越高,要应对的场景也越来越复杂。
2、但现有技术在实现语音识别时,没有考虑到结合用户的历史识别记录来训练预测模型,因此显然现有技术实现的语音识别的效率和效果有所欠缺。可见,现有技术存在缺陷,亟需解决。
技术实现思路
1、本发明所要解决的技术问题在于,提供一种基于数据预测的语音识别方法及系统,能够有效提高语音识别的智能化程度,提高语音识别效率和精度。
2、为了解决上述技术问题,本发明第一方面公开了一种基于数据预测的语音识别方法,所述方法包括:
3、获取目标用户在历史时间段的多个历史语音识别记录;
4、根据所述多个历史语音识别记录,训练得到所述目标用户对应的语音特性预测模型;
5、获取所述目标用户实时发送的实时语音信息,根据所述语音特性预测模型,确定所述实时语音信息对应的预测语音特性参数;
6、根据所述预测语音特性参数,和预设的语音识别算法,对所述实时语音信息进行语音识别。
7、作为一种可选的实施方式,在本发明第一方面中,所述历史语音识别记录包括语音类型、语音识别预处理记录、被识别语音、识别用时和识别算法模型;和/或,所述预测语音特性参数包括语音预处理参数、语音类型参数、语音识别用时参数、语音识别算法参数中的至少一种。
8、作为一种可选的实施方式,在本发明第一方面中,所述根据所述多个历史语音识别记录,训练得到所述目标用户对应的语音特性预测模型,包括:
9、将每一所述历史语音识别记录中的被识别语音作为训练输入数据;
10、将每一所述历史语音识别记录中的语音类型作为第一训练输出数据,根据所述训练输入数据和所述第一训练输出数据,训练得到所述目标用户对应的语音类型预测模型;
11、将每一所述历史语音识别记录中的语音识别预处理记录作为第二训练输出数据,根据所述训练输入数据和所述第二训练输出数据,训练得到所述目标用户对应的预处理预测模型;
12、将每一所述历史语音识别记录中的识别用时和识别算法模型作为第三训练输出数据,根据所述训练输入数据和所述第三训练输出数据,训练得到所述目标用户对应的适配算法预测模型。
13、作为一种可选的实施方式,在本发明第一方面中,所述根据所述语音特性预测模型,确定所述实时语音信息对应的预测语音特性参数,包括:
14、将所述实时语音信息输入至所述语音类型预测模型,以得到输出的所述实时语音信息对应的语音类型参数;
15、将所述实时语音信息输入至所述预处理预测模型,以得到输出的所述实时语音信息对应的语音预处理参数;
16、将所述实时语音信息输入至所述适配算法预测模型,以得到输出的所述实时语音信息对应的语音识别算法参数和语音识别用时参数。
17、作为一种可选的实施方式,在本发明第一方面中,所述根据所述预测语音特性参数,和预设的语音识别算法,对所述实时语音信息进行语音识别,包括:
18、根据所述实时语音信息对应的语音预处理参数,确定出所述实时语音信息对应的预处理算法;
19、根据所述实时语音信息对应的语音类型参数,以及预设的语音类型和算法模型的对应关系,确定出所述实时语音信息对应的多个第一候选算法模型;
20、计算每一所述候选算法模型与所述语音识别算法参数之间的相似度参数;
21、将所述相似度参数最高的所述候选算法模型,确定为所述实时语音信息对应的语音识别算法模型;
22、根据所述预处理算法和所述语音识别算法模型,对所述实时语音信息进行语音识别。
23、作为一种可选的实施方式,在本发明第一方面中,所述实时语音信息包括多个实时语音信息;以及,所述根据所述预处理算法和所述语音识别算法模型,对所述实时语音信息进行语音识别,包括:
24、根据每一所述实时语音信息对应的语音发出先后次序和所述语音识别速度参数,确定目标函数和限定条件;
25、根据所述目标函数和所述限定条件,基于动态规划算法,演算出所述多个实时语音信息对应的语音识别策略;所述语音识别策略用于限定每一所述实时语音信息的识别次序、识别算法和是否识别。
26、作为一种可选的实施方式,在本发明第一方面中,所述目标函数包括语音识别策略中识别的所述实时语音信息的数量达到最多,和语音识别策略中每一所述实时语音信息的识别次序与所述语音发出先后次序之间的次序差的总和达到最小;
27、所述限定条件包括语音识别策略中每一所述实时语音的识别算法为对应的所述预处理算法和所述语音识别算法模型、语音识别策略中每一所述实时语音的语音识别用时参数小于预设的用时限制阈值和语音识别策略中所有所述实时语音的语音识别用时参数小于所述目标用户对应的用户偏好用时阈值。
28、本发明第二方面公开了一种基于数据预测的语音识别系统,所述系统包括:
29、获取模块,用于获取目标用户在历史时间段的多个历史语音识别记录;
30、训练模块,用于根据所述多个历史语音识别记录,训练得到所述目标用户对应的语音特性预测模型;
31、确定模块,用于获取所述目标用户实时发送的实时语音信息,根据所述语音特性预测模型,确定所述实时语音信息对应的预测语音特性参数;
32、识别模块,用于根据所述预测语音特性参数,和预设的语音识别算法,对所述实时语音信息进行语音识别。
33、作为一种可选的实施方式,在本发明第二方面中,所述历史语音识别记录包括语音类型、语音识别预处理记录、被识别语音、识别用时和识别算法模型;和/或,所述预测语音特性参数包括语音预处理参数、语音类型参数、语音识别用时参数、语音识别算法参数中的至少一种。
34、作为一种可选的实施方式,在本发明第二方面中,所述训练模块根据所述多个历史语音识别记录,训练得到所述目标用户对应的语音特性预测模型的具体方式,包括:
35、将每一所述历史语音识别记录中的被识别语音作为训练输入数据;
36、将每一所述历史语音识别记录中的语音类型作为第一训练输出数据,根据所述训练输入数据和所述第一训练输出数据,训练得到所述目标用户对应的语音类型预测模型;
37、将每一所述历史语音识别记录中的语音识别预处理记录作为第二训练输出数据,根据所述训练输入数据和所述第二训练输出数据,训练得到所述目标用户对应的预处理预测模型;
38、将每一所述历史语音识别记录中的识别用时和识别算法模型作为第三训练输出数据,根据所述训练输入数据和所述第三训练输出数据,训练得到所述目标用户对应的适配算法预测模型。
39、作为一种可选的实施方式,在本发明第二方面中,所述确定模块根据所述语音特性预测模型,确定所述实时语音信息对应的预测语音特性参数的具体方式,包括:
40、将所述实时语音信息输入至所述语音类型预测模型,以得到输出的所述实时语音信息对应的语音类型参数;
41、将所述实时语音信息输入至所述预处理预测模型,以得到输出的所述实时语音信息对应的语音预处理参数;
42、将所述实时语音信息输入至所述适配算法预测模型,以得到输出的所述实时语音信息对应的语音识别算法参数和语音识别用时参数。
43、作为一种可选的实施方式,在本发明第二方面中,所述识别模块根据所述预测语音特性参数,和预设的语音识别算法,对所述实时语音信息进行语音识别的具体方式,包括:
44、根据所述实时语音信息对应的语音预处理参数,确定出所述实时语音信息对应的预处理算法;
45、根据所述实时语音信息对应的语音类型参数,以及预设的语音类型和算法模型的对应关系,确定出所述实时语音信息对应的多个第一候选算法模型;
46、计算每一所述候选算法模型与所述语音识别算法参数之间的相似度参数;
47、将所述相似度参数最高的所述候选算法模型,确定为所述实时语音信息对应的语音识别算法模型;
48、根据所述预处理算法和所述语音识别算法模型,对所述实时语音信息进行语音识别。
49、作为一种可选的实施方式,在本发明第二方面中,所述实时语音信息包括多个实时语音信息;以及,所述识别模块根据所述预处理算法和所述语音识别算法模型,对所述实时语音信息进行语音识别的具体方式,包括:
50、根据每一所述实时语音信息对应的语音发出先后次序和所述语音识别速度参数,确定目标函数和限定条件;
51、根据所述目标函数和所述限定条件,基于动态规划算法,演算出所述多个实时语音信息对应的语音识别策略;所述语音识别策略用于限定每一所述实时语音信息的识别次序、识别算法和是否识别。
52、作为一种可选的实施方式,在本发明第二方面中,所述目标函数包括语音识别策略中识别的所述实时语音信息的数量达到最多,和语音识别策略中每一所述实时语音信息的识别次序与所述语音发出先后次序之间的次序差的总和达到最小;
53、所述限定条件包括语音识别策略中每一所述实时语音的识别算法为对应的所述预处理算法和所述语音识别算法模型、语音识别策略中每一所述实时语音的语音识别用时参数小于预设的用时限制阈值和语音识别策略中所有所述实时语音的语音识别用时参数小于所述目标用户对应的用户偏好用时阈值。
54、本发明第三方面公开了另一种基于数据预测的语音识别系统,所述系统包括:
55、存储有可执行程序代码的存储器;
56、与所述存储器耦合的处理器;
57、所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的基于数据预测的语音识别方法中的部分或全部步骤。
58、本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的基于数据预测的语音识别方法中的部分或全部步骤。
59、与现有技术相比,本发明具有以下有益效果:
60、本发明能够根据用户的历史语音识别记录来训练得到用户专属的语音特性预测模型,以用于确定实时语音的特性,并基于特性对实时语音进行识别,从而能够有效提高语音识别的智能化程度,提高语音识别效率和精度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/23410.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。