技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种基于人工智能的英语语音信号处理的识别方法  >  正文

一种基于人工智能的英语语音信号处理的识别方法

  • 国知局
  • 2024-08-05 12:00:30

本发明属于英语语音信号识别,涉及到一种基于人工智能的英语语音信号处理的识别方法。

背景技术:

1、随着全球化进程的加速推进,英语作为国际交流的主要语言之一,其翻译需求日益增加。传统的翻译方式往往效率低下,无法满足实时翻译的需求。而基于人工智能的英语语音信号的处理识别系统可以实现实时、准确的翻译,大大提高了翻译效率和质量。

2、已有的基于人工智能的英语语音信号的处理识别系统已经基本满足使用需求,但是仍然存在一定的不足之处:一方面,已有的基于人工智能的英语语音信号的处理识别系统能够获取英语语音信号的特征参数,并对其进行进一步的处理,得到英语语音信号对应的英语文本,结合语言模型和解码算法实现跨语言的转换,但是已有的基于人工智能的英语语音信号的处理识别系统缺乏对英语语音信号的特征参数与其对应的标准特征参数的偏差进行分析,从而可能发生由于不同语言之间的语音特征和发音习惯存在差异而导致的在进行英语语音翻译时的不准确性和鲁棒性。

3、另一方面,已有的基于人工智能的英语语音信号的处理识别系统也缺乏对存在较大偏差的英语语音信号的特征参数进行修正,从而无法精准地匹配英语语言和目标语言之间的语音特征,降低了语音翻译的质量和准确性。

技术实现思路

1、鉴于此,为解决上述背景技术中所提出的问题,现提出一种基于人工智能的英语语音信号处理的识别方法。

2、本发明的目的可以通过以下技术方案实现:本发明提供一种基于人工智能的英语语音信号处理的识别方法,包括:s1、语音信号数据获取:获取待处理的英语语音信号数据,并将其记为目标英语语音信号数据。

3、s2、语音帧划分:根据预定义原则将目标英语语音信号数据划分为目标英语语音信号数据对应各英语语音帧。

4、s3、特征参数提取:提取目标英语语音信号数据对应各英语语音帧的特征参数,其中特征参数包括梅尔频率倒谱系数、短时能量和过零率。

5、s4、偏差系数分析:根据目标英语语音信号对应各英语语音帧的特征参数,分析目标英语语音数据的偏差系数,并判断目标英语语音信号数据的修正需求,若其需求为需求修正需求,则执行s5,反之,则执行s6。

6、s5、修正系数分析:将目标英语语音数据的偏差系数与数据库中的偏差系数集进行对比,若偏差系数集中存在某偏差系数与目标英语语音数据的偏差系数相一致,则根据该偏差系数对应的修正系数对其进行修正,反之,则分析目标英语语音数据的偏差系数对应的修正系数,并将其进行修正。

7、s6、语音信号数据识别:将修正后的目标英语语音信号数据进行识别,得到目标英语语音信号数据对应的英语文本数据。

8、s7、语音信号数据处理:将目标英语语音信号数据对应的英语文本数据根据设定转换原则进行转换得到目标语言文本数据。

9、相较于现有技术,本发明的有益效果如下:1、本发明通过获取目标英语语音信号数据,并提取目标英语语音信号数据对应各英语语音帧的梅尔频率倒谱系数、短时能量和过零率等特征参数,从而能够反映人耳对不同频率声波的感知特性,了解语音信号的开始和结束以及强弱变化,分析语音信号的频率成分,进而有助于目标英语语音信号数据被更好地理解和识别,有助于其的分割和语音活动的检测,有利于更深入地了解目标英语语音信号的特性和结构,也为后续的英语语音的识别和合成提供了有力的支持。

10、2、本发明通过分析目标英语语音数据的偏差系数,并判断目标英语语音信号数据的修正需求,有效地规避了由于不同语言之间的语音特征和发音习惯存在差异而导致的在进行英语语音翻译时的不准确性和鲁棒性,有助于进一步优化翻译算法,提高翻译的准确性和自然度,推动了英语语音信号处理技术的不断进步。

11、3、本发明通过对存在较大偏差的目标英语语音信号数据进行修正,从而有利于精准地匹配目标英语语音信号数据对应的语言和目标语言之间的语音特征,有助于提高目标英语语音信号数据翻译的质量和准确性,促进了跨文化交流。

技术特征:

1.一种基于人工智能的英语语音信号处理的识别方法,其特征在于:包括:

2.根据权利要求1所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述将目标英语语音信号数据划分为目标英语语音信号数据对应各英语语音帧的预定义原则的具体过程为:

3.根据权利要求1所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述提取目标英语语音信号数据对应各英语语音帧的梅尔频率倒谱系数的具体过程为:

4.根据权利要求3所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述提取目标英语语音信号数据对应各英语语音帧的短时能量的具体过程为:

5.根据权利要求4所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述提取目标英语语音信号数据对应各英语语音帧的过零率的具体过程为:

6.根据权利要求5所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述目标英语语音数据的偏差系数的具体分析过程为:

7.根据权利要求6所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述目标英语语音信号数据的修正需求的具体判断过程为:提取目标英语语音数据的偏差系数,将其与设定的偏差系数阈值进行对比,若目标英语语音数据的偏差系数大于设定的偏差系数阈值,则将目标英语语音数据的修正需求记为需要修正需求,反之,则将目标英语语音数据的修正需求记为无需修正需求。

8.根据权利要求6所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述目标英语语音数据的偏差系数对应的修正系数的具体分析过程为:提取目标英语语音数据的偏差系数,根据分析公式得到目标英语语音数据的偏差系数对应的修正系数其中ξ0为设定的偏差系数阈值。

9.根据权利要求6所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述目标英语语音信号数据对应的英语文本数据的具体获得过程为:将修正后的目标英语语音信号数据对应各英语语音帧的特征参数上传至声学模型中,通过解码算法生成目标英语语音信号数据对应各英语语音帧的候选单词序列,并结合语言模型,生成的目标英语语音信号数据对应的英语文本数据。

10.根据权利要求9所述的一种基于人工智能的英语语音信号处理的识别方法,其特征在于:所述将目标英语语音信号数据对应的英语文本数据转换得到目标语言文本数据的设定转换原则的具体内容为:将目标英语语音信号数据对应的英语文本数据输入到机器翻译模型中,模型根据学习到的英语文本数据到目标语言文本数据的对应规则和上下文信息,生成对应的目标语言文本数据。

技术总结本发明属于英语语音信号识别技术领域,涉及到一种基于人工智能的英语语音信号处理的识别方法。本发明通过提取目标英语语音信号数据对应各英语语音帧的梅尔频率倒谱系数、短时能量和过零率等特征参数,有利于更深入地了解目标英语语音信号的特性和结构,为后续的英语语音的识别和合成提供了有力的支持,通过分析目标英语语音数据的偏差系数,并判断其的修正需求,避免了由于不同语言之间的语音特征和发音习惯存在差异而导致的在进行英语语音翻译时的不准确性和鲁棒性,提高了翻译的准确性和自然度,通过对存在较大偏差的目标英语语音信号数据进行修正,有助于提高目标英语语音信号数据翻译的质量和准确性。技术研发人员:张彧凤,赵擎华受保护的技术使用者:山西警察学院技术研发日:技术公布日:2024/8/1

本文地址:https://www.jishuxx.com/zhuanli/20240802/260593.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。