一种基于贝叶斯算法在线检测语音识别的公私资源调度方法、系统以及介质与流程
- 国知局
- 2024-06-21 10:44:26
本发明涉及语音识别领域,更具体地,涉及一种基于贝叶斯算法在线检测语音识别的公私资源调度方法、系统以及介质。
背景技术:
1、随着语音识别技术的发展,越来越多的应用场景需要对语音进行实时识别,如智能客服、智能家居、语音助手等。目前的语音识别系统普遍存在着资源调度不合理、质量不稳定、使用成本高等问题,因此需要一种新的技术来解决这些问题。传统语音识别应用场景调用第三方语音合成引擎,主要有公有云和私有云部署两种方式:一方面,语音识别需要大量的计算资源,包括计算能力、存储能力等,公有云部署资源具有弹性的优势,但时延、安全性要求比较高;另一方面,语音识别本地部署虽在弹性扩容方面有劣势,但具有时延低、安全可靠、一次性投资长期私有高效使用的特定。基于以上两个方面分析,单一语音识别资源调度方式存在着资源调度不合理、质量不稳定、安全性等问题,因此如何合理调度和高效使用语音识别资源成为一项挑战。
2、为了解决上述问题,本发明提供了一种基于贝叶斯后验临界值在线检测及置信度算法的语音识别公私资源调度的方法、系统以及介质。该方法及系统可以自动根据当前的资源情况和语音识别需求,智能地调度公有资源和私有资源,从而保证语音识别质量和效率。
技术实现思路
1、本发明旨在克服上述现有技术的至少一种缺陷(不足),提供一种基于贝叶斯后验临界值在线检测及置信度算法的语音识别公私资源调度的方法及系统,用于解决语音识别系统存在资源调度不合理、质量不稳定、使用成本高等问题。
2、本发明采取的技术方案是,一种基于贝叶斯算法在线检测语音识别的公私资源调度方法,包括以下步骤:s1.选择拟进行语音识别的某一段语音信号x,计算该语音信号x的语音识别的参考标准;s2.获取多个语音识别模型对该语言段进行语音识别的多个识别结果;s3.将多个识别结果与参考标准进行比较获得多个语音识别模型的比较结果;s4.根据比较结果选择语音识别模型并对公私资源进行调度;s5.结合所调度的公私资源和对应语音识别模型进行语音识别。该方法可以自动根据当前的资源情况和语音识别需求,智能地调度公共资源和私有资源,从而保证语音识别质量和效率。
3、优选地,在所述步骤s1中,所述参考标准包括语音识别的准确性标准,所述准确性标准通过以下方法计算:
4、s11.根据贝叶斯算法,计算给定的语音信号x,某个识别结果h发生的概率,计算出后验概率p(h|x)作为置信度;
5、s12.通过比较不同识别结果的置信度,选择置信度最高的结果作为准确性标准。
6、利用贝叶斯算法后验概率来对数据进行分类和预测,从而获得语音识别准确性参考的标准,为判别语音识别模型识别结果的准确性提供了可靠的参考标准。
7、优选地,在所述步骤s3中,所述比较结果包括准确性标准的置信度高、置信度中和置信度低三个等级,所述置信度高指后验概率p(h|x)高于等于70%,所述置信度中指后验概率p(h|x)在30%-70%之间,所述置信度低指后验概率p(h|x)低于等于30%;
8、所述将多个识别结果与参考标准进行比较具体包括:
9、s31.将多个识别结果分别与所述准确性标准进行比较,得到不同语音识别模型的识别准确性;
10、s32.设定一准确性阈值,筛选识别准确性超过所述准确性阈值的语音识别模型;
11、s33.通过贝叶斯算法计算筛选后的语音识别模型属于准确性标准的置信度高、置信度中和置信度低的那一等级。
12、根据所得属于准确性标准的置信度等级来确定优先级,从而根据优先级来对可用资源进行调度,使得资源能够得到合理的分配,并且使资源能够得到高效利用,避免造成资源浪费。
13、优选地,在所述步骤s1中,所述参考标准还包括语音识别的实时性标准,所述实时性标准根据历史数据统计分析,找出在该时间范围内的置信度阈值,作为实时性标准;所述步骤s1中,还包括对准确性标准和实时性标准进行调整和优化的步骤,以达到最佳的准确性和实时性的平衡。
14、利用准确性和实时性这两个特征来判别语音识别模型的优劣,可以选出最佳的语音识别模型,保证了所选择出来的模型在准确性高的同时计算所需的时间也少。
15、优选地,在所述步骤s3中,所述比较结果包括实时性标准的置信度高、置信度中、置信度中低和置信度低四个等级,所述置信度高指算法的响应时间t≤10s,置信度中指算法响应时间10s<t≤30s,置信度中低指算法响应时间30s<t≤60s,置信度低指算法响应时间t>60s;
16、所述将多个识别结果与参考标准进行比较具体还包括:
17、s34.将多个识别结果的时间分别与所述实时性标准进行比较,得到不同语音识别模型的识别实时性;
18、s35.设定一实时性阈值,筛选识别实时性优于所述实时性阈值的语音识别模型;
19、s36.通过贝叶斯算法计算筛选后的语音识别模型属于实时性标准的置信度高、置信度中、置信度中低和置信度低的那一等级。
20、进一步地,除了准确性这个模型评判标准外,还包括了实时性这个评判标准,实时性可以检测模型识别语音的速度,语音识别速度同样是评判一个模型好坏的指标之一,结合模型准确性这一指标,只有这样才能将语音识别模型的优劣做好等级分类,才能更好的根据优先级为它们动态分配资源,使语音识别模型的性能能够得到进一步的提升。
21、进一步优选地,所述步骤s4中依据以下规则对公私资源进行调度:
22、s41.当准确性标准的置信度高,实时性标准的置信度高时,选择私有资源;
23、s42.当准确性标准的置信度高,实时性标准的置信度中,或者准确性标准的置信度中,实时性标准的置信度高时,选择私有资源,当私有资源不可用或性能较差时,选择公有资源;
24、s43.当准确性标准的置信度高,实时性标准的置信度中低时,选择私有资源,当私有资源不可用或性能较差时,选择公有资源;
25、s44.当准确性标准的置信度中,实时性标准的置信度中,或者准确性标准的置信度中,实时性标准的置信度中低时,选择私有资源,当私有资源不可用或性能较差时,选择不进行语音识别,并给出相应提示或处理方式;
26、s45.当准确性标准的置信度为低或者实时性标准的置信度为低时,选择不进行语音识别,并给出相应提示或处理方式。
27、通过同时衡量准确性和实时性这两个标准的置信度,实现对所得到的语音识别模型进行分类,从而实现对语音识别资源的动态调度,能够提高语音识别的准确性和实时性,同时保证资源的高效利用。
28、更进一步地,所述步骤s4中私有资源的选择优先级规则s41优于s42优于s43优于s44。私有资源相对于公有资源的时延性更低,可以提供更高的数据安全性和隐私保护,并且能够提供更多更优的计算资源可供语音识别模型使用,而对于在步骤s41中通过贝叶斯算法计算所得到的语音识别模型的准确性和实时性这两个标准的置信度都处于高的等级中,因此对于这种优秀的语音识别模型应该给其配分更多更好的资源,保证语音识别系统能够合理地调度资源,保证了语音识别的质量,同时还能够控制好使用成本。
29、优选地,所述的基于贝叶斯算法在线检测语音识别的公私资源调度方法还包括设置了可视化界面来查看资源情况和调度情况。通过可视化界面可以直观地看到语音识别时资源调度的情况,根据实时的资源情况及时进行资源调度的调整,进一步地保证了资源的高效利用,避免了资源的浪费,同时还能保证语音识别的准确性和实时性处于一个最优的状态。
30、优选地,在基于贝叶斯算法在线检测语音识别的公私资源调度方法中,所述的某段语音信号的时长为30s-60s,在步骤s1之前,还包括根据对输入语音信号分类选择贝叶斯网络的拓扑结构步骤,具体为:
31、s001.基于已知大量语音数据样本通过学习确定常见的语音信号模型,将语音信号切割为多个语音帧,每个语音帧包括声道特征、音素特征、语音特征和声音单元,根据上述语音特征建立语音信号的结构树;
32、s002.利用评分函数,寻找与训练样本匹配最好且结构最优的贝叶斯网络拓扑结构,具体选择如下:
33、对于同父结构,给定父节点x1的取值,x2与x3条件独立,则p(x2,x3|x1)=p(x2|x1)p(x3|x1);
34、对于顺序结构,给定中间节点x1的取值,则x2与x3条件独立,有p(x2,x3|x1)=p(x2|x1)p(x3|x1);
35、对于v型结构,给定子节点x1的取值,则x2与x3独立,但不是条件独立的,即p(x2,x3|x1)≠p(x2|x1)p(x3|x1),p(x2,x3)≠p(x2)p(x3)。
36、通过上述操作可以选择出与训练样本匹配最好且结构最优的贝叶斯网络拓扑结构,为语音信号x提供更具参考价值的语音识别参考标准,以提高语音识别的准确性。
37、优选地,所述基于贝叶斯算法在线检测语音识别的公私资源调度系统,包括:语音识别模块、在线检测模块、贝叶斯网络模型模块、资源调度模块。其中:
38、语音识别模块用于接收输入的语音信号,并将其转换为文本信息;
39、在线检测模块用于实时检测语音识别的准确度,并输出相应的检测结果;
40、贝叶斯网络模型模块用于根据语音识别的结果计算后验概率,并确定阈值;
41、资源调度模块用于根据系统资源和用户需求,动态地分配和调度公私资源对语音识别模型进行语音识别。
42、该系统可以自动根据当前的资源情况和语音识别需求,智能地调度公共资源和私有资源,从而保证语音识别质量和效率。
43、进一步优选地,一种计算机可读存储介质,所述的存储介质存储有语音识别系统所需的计算机程序和数据,所述计算机程序被用于执行上述基于贝叶斯算法在线检测语音识别的公私资源调度方法。
44、与现有技术相比,本发明的有益效果为:
45、本发明提供了一种高效、精准的语音识别公私资源调度方法及系统,通过基于贝叶斯后验概率模型的语音识别、在线检测算法和置信度算法,能够实现对语音输入的在线检测和处理,并根据检测结果动态地调度可用资源,能够提高语音识别的准确性和实时性,同时保证资源的高效利用。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21470.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表