技术新讯 > 乐器声学设备的制造及制作,分析技术 > 一种英文发音评测方法、装置、设备和可读存储介质与流程  >  正文

一种英文发音评测方法、装置、设备和可读存储介质与流程

  • 国知局
  • 2024-06-21 11:44:26

本技术涉及到英文评测,特别是涉及到一种英文发音评测方法、装置、设备和可读存储介质。

背景技术:

1、当下的经济发展和文化交流,对个人的外语能力要求越来越高。如何快速高效地获取外语技能,是语言教育迫切需要解决的问题,日益发达的计算机技术,特别是人工智能技术,是实现高效语言学习的重要途径。例如,计算机辅助语言学习技术,可以快速地对学习者的口语进行测评,并指出具体的错误,学习者可以据此有针对性地练习和提高。随着全球化的发展和国际交流的增加,英文口语能力越来越受到重视。许多人在学习英语时面临着发音不标准、语流不自然等问题。传统的口语教学方法通常需要借助老师的指导和反复练习才能改善。但这种方法有时效性差、教学成本高、反馈不及时等问题。

2、现有的自动化语音识别技术虽然可以识别发音,但是对于英文发音质量的评价不够细致,不能提供准确的评分;另外,现有的发音评测方法缺乏针对个人发音特点的个性化反馈,难以有效地帮助学生改进英文发音。

3、因此,现有技术存在缺陷,需要改进。

技术实现思路

1、为了解决现有技术中的一个或者几个问题,本技术的主要目的为提供一种英文发音评测方法、装置、设备和可读存储介质。

2、为了实现上述发明目的,本技术提出一种英文发音评测方法,所述方法包括:

3、实时接收英文的训练请求;

4、当接收到英文的训练请求时,生成单元训练数据,并在每个预设时间段内收集学生端的每个原发音数据;

5、将所述每个原发音数据输入已训练的卷积神经网络模型中进行识别匹配,得到阅读数据包,所述阅读数据包包括不标准发音数据、标准程度打分、标准音频数据及所述原发音数据;

6、将所述阅读数据包的结果发送至学生端和教师端;

7、提取所述不标准发音数据,识别出不标准发音数据的具体错误类型;

8、根据所述具体错误类型的比例生成相应数量的发音练习数据,并将所述发音练习数据发送至学生端。

9、进一步地,所述将所述每个原发音数据输入已训练的卷积神经网络模型中进行识别匹配,得到阅读数据包,包括:

10、将所述原发音数据进行转化为频谱图形式,再将所述频谱图输入已训练的卷积神经网络模型中进行特征识别;

11、通过所述卷积神经网络模型对识别到的特征与标准发音进行发音准确程度对比,根据准确发音数量而输出标准程度分数;

12、获取卷积神经网络模型识别到所述频谱图对应的标准音频数据;

13、基于所述不标准发音数据、原发音数据、标准音频数据及标准程度分数生成阅读数据包。

14、进一步地,所述识别出不标准发音数据的具体错误类型包括:

15、获取所述不标准发音数据;

16、对每个所述不标准发音数据进行切分处理,得到音素序列;

17、将音素序列与标准发音的音素序列进行对比,计算音素序列之间的相似度;

18、若所述相似度低于预设的阈值时,则判断所述不标准发音数据的类型包括有音素错误;

19、提取所述不标准发音数据的语音信号,并将所述语音信号转换为句子;

20、计算相邻句子之间的停顿时间,判断所述停顿时间是否超过预设的标准发音的阈值范围;

21、若所述停顿时间超过预设的标准发音的阈值范围,则判断所述不标准发音数据的类型包括有发音不连贯。

22、进一步地,所述英文的训练请求还包括英文对话训练请求,包括:

23、当接收到英文对话训练请求时,生成问答训练数据,并在预设时间段内收集学生端的回答语音数据;

24、判断所述回答语音数据是否满足生成下一个问答训练数据的条件;

25、若所述回答语音数据在标准的回答数据的范围之内,则判定所述回答语音数据满足生成下一个问答训练数据的条件;

26、基于回答语音数据的结果生成下一个问答训练数据。

27、进一步地所述方法还包括:

28、获取所述不标准发音数据,分析所述不标准发音数据对应的文本难度等级;

29、根据所述不标准发音数据对应的文本难度等级,对不同难度等级文本的发音标准程度进行打分,其中,所述发音标准程度打分包括:基于高难度等级的文本,降低打分的发音准确性阈值,基于低难度等级的文本,升高打分的发音准确性阈值。

30、进一步地,所述方法还包括收集学生端发音时的脸部数据,包括:

31、获取学生端发音时的口型;

32、将所述口型与标准发音的口型对比,并判断学生端发音时的口型与标准发音的口型对比是否在预设的差异范围内;

33、若所述学生端发音时的口型与标准发音的口型对比在预设的差异范围内,则获取学生端发音时的舌位;

34、将所述舌位与标准发音的舌位对比,并判断学生端发音时的舌位与标准发音的舌位对比是否在预设的差异范围内;

35、若所述学生端发音时的舌位与标准发音的舌位对比在预设的差异范围内,则获取学生端发音时的唇形;

36、将所述唇形与标准发音的唇形对比,并判断学生端发音时的唇形与标准发音的唇形对比是否在预设的差异范围内;

37、若所述学生端发音时的唇形与标准发音的唇形对比在预设的差异范围内,则判断学生端发音时的脸部数据为标准数据。

38、进一步地,所述识别出不标准发音数据的具体错误类型还包括:

39、获取不标准发音数据,提取所述不标准发音数据的语音信号;

40、将所述语音信号中的连续的语音信号分割成语义单元;

41、将所述语义单元通过快速傅里叶法变换和归一化处理,得到频谱数据;

42、提取所述频谱数据中的最大幅度值,通过所述最大幅度值计算音调的频率;

43、将所述音调频率与标准发音数据库进行评率对比,当所述音调频率超出所述标准发音数据库的范围内,则判断所述不标准发音数据的类型包括有语调错误;

44、所述音调的频率的公式为:f0=f_peak/2^(n/2),其中,f0是计算出的基频,单位是赫兹(hz),f_peak是频谱中的所述峰值频率,单位是赫兹(hz),n是采样点数。

45、本技术实施例还提供一种英文发音评测装置,包括:

46、接收模块,用于实时接收英文的训练请求;

47、生成模块,用于当接收到英文的训练请求时,生成单元训练数据,并在每个预设时间段内收集学生端的每个原发音数据;

48、识别模块,用于将所述每个原发音数据输入已训练的卷积神经网络模型中进行识别匹配,得到阅读数据包,所述阅读数据包包括不标准发音数据、标准程度打分、标准音频数据及所述原发音数据;

49、第一发送模块,用于将所述阅读数据包的结果发送至学生端和教师端;

50、提取模块,用于提取所述不标准发音数据,识别出不标准发音数据的具体错误类型;

51、第二发送模块,用于根据所述具体错误类型的比例生成相应数量的发音练习数据,并将所述发音练习数据发送至学生端。

52、本技术还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

53、本技术还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

54、本技术实施例的英文发音评测方法、装置、设备和存储介质,终端通过实时接收英文的训练请求,英文训练中,可包括有英文单词的训练或者英文句子的训练,当接收到学生端选择的英文的训练请求时,生成单元训练数据,将学生端在训练时每个原发音数据输入已训练的卷积神经网络模型中进行匹配,通过将已训练的卷积神经网络模型可匹配到与原发音数据对应的阅读数据包,将阅读的数据包发送给学生端和教师端,教师端可通过收听学生端阅读时的原发音数据以及原发音数据的打分情况,从而减少教师端的时间,提高工作效率,可快速了解到学生的学习情况,学生端也可了解到阅读的情况,通过不断矫正英文读音,提高学习的时效性,基于标准程度的打分数据,可分析学生端的学习情况,对不标准发音数据进行识别出不标准发音数据的具体错误类型,根据错误类型的比例推荐相应的发音练习数据给学生端,学生端针对发音不准的类型英文进行针对性练习,提高发音的矫正效果。

本文地址:https://www.jishuxx.com/zhuanli/20240618/23259.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。