基于人工智能的语音识别方法与流程
- 国知局
- 2024-06-21 11:57:38
本发明涉及语音识别,具体涉及基于人工智能的语音识别方法。
背景技术:
1、随着人工智能技术的快速发展,服务于不同领域和对象的专业智能设备被不断地研发出来,为工业、生活、娱乐和教育等领域提供了极大的帮助和便利;通过将智能算法的引入和数据融合技术运用到语音识别领域,并且随着语音端到端识别技术的研究日趋成熟,语音识别模型的网络框架设计方案越发丰富。
2、现有的基于人工智能的语音识别方法大多用于语音信息的读取、转换以及语音信息的翻译等,通过提取声音特征并进行建模的应用运用在各个方面,包括音乐识别、声音时间的检测以及人声识别等,构建了相对完整的声像数据库,通过智能化的ai识别技术运用提高了声像数据库的检索和精确化应用。
3、然而现有的语音识别技术仅考虑语音音频信息的提取,缺少对不同场景环境条件下的音频对语音信息的识别准确性的影响,特别忽视了环境噪音对语音信息识别准确性的影响;进而直接对场景语音信息进行提取调用,导致执行信号的错误识别。
技术实现思路
1、本发明的目的在于提供基于人工智能的语音识别方法,解决以下技术问题:
2、怎样提高场景环境条件下的语音信息识别的准确性。
3、本发明的目的可以通过以下技术方案实现:
4、基于人工智能的语音识别方法,所述方法包括:
5、s1、根据空间图像大小和噪音分布状态获取场景状态系数;
6、s2、采集当前语音信号进行降噪处理并对降噪处理后的语音信号进行预处理和提取语音特征参数;
7、s3、根据历史信息主题库对语音特征参数进行关键词筛选,获取关键字段;
8、s4、分析场景状态系数匹配场景主题信息并调用与该场景主题信息相匹配的关键字段,并执行调用指令。
9、优选地,所述步骤s1中:
10、s11、采集空间图像三维图像,获取空间体积大小,确定不同声音场景下的动态标准噪音参数曲线;
11、s12、将当前声音场景运行区间下的实时噪音参数集合随时间变化的大小的曲线;
12、s13、将曲线与曲线在同一坐标系中建立,计算不同声音场景下对应时间段的重合面积;其中,为场景类型;
13、s14、将与对应场景的标准重合面积进行比对:
14、若<,则判断当前场景状态不符;
15、若≥,则判断当前场景状态符合,获取场景状态系数。
16、优选地,所述场景状态系数的获取方式为:
17、将噪音参数与预设场景下的噪音参数阈值进行比对大小:
18、若大于,则输出常数值a作为当前时刻场景识别参数;
19、若小于,则输出,且≠a;其中,为当前时刻场景识别参数,为权重系数,且>0;
20、获取采集总时间段的场景识别参数为每个时间点场景识别参数的总和的均值;
21、通过公式计算出整体场景状态系数,其中,为场景应用系数。
22、优选地,所述步骤s2中:
23、s21、获取语音信号进行特征提取获取声学特征;
24、s22、将声学特征输入到注意机制语音识别模型进行编码集解码计算获取源输入序列与输出序列之间的关联性特征;
25、s23、根据关联性特征合并语音帧识别结果获取语音特征参数作为识别结果。
26、优选地,所述步骤s3中:
27、s31、将语音特征参数作为文本训练集作为训练样本输入预设语言训练模型;
28、s32、使用分词模块对文本训练集中每条文本增加起始符与结束符,基于设定的语法规则将输入的文本训练集分解为若干独立单词;
29、s33、统计分词后的文本训练集中全部单词所出现次数,记为词频;
30、s34、通过获得的词频确定当前出现的具体单词,判断其词频阈值大于预设词频阈值的单词作为关键词;
31、s35、计算关键词基于其前一个单词影响所出现的概率值大于预设概率值的连续的关键词作为关键字段输出。
32、优选地,所述步骤s4中:
33、s41、分析当a时,为0;当a时,则;
34、s42、将与预设阈值、进行比对,且>>0:
35、若≥,则判断场景环境状态好,调用指令匹配调用当前场景主题信息的关键字段;
36、若>>,则判断场景环境状态差,发出预警信号;
37、若≤,则判断场景环境状态极差,发出告警信号并进行场景环境更换。
38、优选地,所述场景主题信息的获取和调用方式为:
39、大数据库中包含不同语音状态下的多个场景,每个场景中储存有与该场景相关的关键词,将该场景中的关键词作为场景主题信息,通过调用指令匹配调用相同和相似的关键字段。
40、优选地,所述步骤s3还包括将语音特征参数作为样本进行语音情感识别,具体方法包括:
41、ss1、将历史语料库中的语音样本经过预处理后提取情感特征;
42、ss2、将情感特征输入分类器中进行训练构建情感识别分类模型;
43、ss3、将实时测试样本输入情感识别分类模型输出语音情感词语。
44、优选地,所述语音情感词语通过情绪表情符号进行显示。
45、本发明的有益效果:本发明通过空间及噪音获取场景状态系数,并获取当前场景的空间图像大小信息及噪音分布状态对当前场景的状态影响进行判定并做进一步的分析,并采集当前语音信号进行降噪处理并对降噪处理后的语音信号进行预处理和提取语音特征参数,通过排除区域噪音周围环境对声音采集的干扰并将声音信号与噪音进行区分,保证对采集的语音信号进行准确的信息提取过程。
46、当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
技术特征:1.基于人工智能的语音识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的基于人工智能的语音识别方法,其特征在于,所述步骤s2中:
3.根据权利要求1所述的基于人工智能的语音识别方法,其特征在于,所述步骤s3中:
4.根据权利要求1所述的基于人工智能的语音识别方法,其特征在于,所述步骤s4中:
5.根据权利要求4所述的基于人工智能的语音识别方法,其特征在于,所述场景主题信息的获取和调用方式为:
6.根据权利要求1所述的基于人工智能的语音识别方法,其特征在于,所述步骤s3还包括将语音特征参数作为样本进行语音情感识别,具体方法包括:
7.根据权利要求6所述的基于人工智能的语音识别方法,其特征在于,所述语音情感词语通过情绪表情符号进行显示。
技术总结本发明涉及语音识别技术领域,具体公开了基于人工智能的语音识别方法,所述方法包括:首先,根据空间图像大小和噪音分布状态获取场景状态系数;然后,采集当前语音信号进行降噪处理并对降噪处理后的语音信号进行预处理和提取语音特征参数;接着,根据历史信息主题库对语音特征参数进行关键词筛选,获取关键字段;最后,分析场景状态系数匹配场景主题信息并调用与该场景主题信息相匹配的关键字段,并执行调用指令;本发明通过空间及噪音获取场景状态系数,采集当前语音信号提取语音特征参数,通过排除区域噪音周围环境对声音采集的干扰并将声音信号与噪音进行区分,保证降低环境噪音对语音信息识别准确性的影响。技术研发人员:华锋受保护的技术使用者:无锡康斯泰科技股份有限公司技术研发日:技术公布日:2024/6/11本文地址:https://www.jishuxx.com/zhuanli/20240618/24734.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表