发音异常检测方法、发音异常检测装置以及程序与流程
- 国知局
- 2024-06-21 11:26:23
本公开涉及发音异常检测方法、发音异常检测装置以及程序。
背景技术:
1、作为检测无法正常发音的状态即发音异常(也称为发音障碍)的技术,例如在非专利文献1中公开了使用深度学习(deep learning)来分析语音的方法。
2、现有技术文献
3、非专利文献
4、非专利文献1:"ieee femh voice data challenge 2018"chandrasekarvppallapati,shaprat kedari,archana rmalingamm,2018ieee internationalconference on big data
技术实现思路
1、发明所要解决的课题
2、然而,在使用这样的学习的方法中,检测精度依赖于训练数据(也称为教师数据)的量和质量,但难以大量地确保发音异常时的训练数据。由此,例如,无法检测训练数据中不存在的病态的发音异常。
3、本公开的目的在于提供能够不依赖于发音异常时的训练数据的数据量而提高检测精度的发音异常检测方法、发音异常检测装置以及程序。
4、用于解决课题的手段
5、本公开的一个方式的发音异常检测方法,根据说话者的讲话数据计算声学特征量,使用学习完毕的dnn(deep neural network),根据所述声学特征量计算表示所述讲话数据的说话者属性的第一说话者特征量,计算所述说话者的健全时的说话者特征量即第二说话者特征量与所述第一说话者特征量之间的相似度,基于所述相似度,判定所述说话者的发音异常。
6、发明效果
7、本公开能够提供不依赖于发音异常时的训练数据的数据量而能够提高检测精度的发音异常检测方法、发音异常检测装置以及程序。
技术特征:1.一种发音异常检测方法,
2.如权利要求1所述的发音异常检测方法,
3.如权利要求1所述的发音异常检测方法,
4.如权利要求1所述的发音异常检测方法,
5.如权利要求4所述的发音异常检测方法,
6.如权利要求4所述的发音异常检测方法,
7.如权利要求4所述的发音异常检测方法,
8.一种发音异常检测装置,具备:
9.一种程序,使计算机执行权利要求1所述的发音异常检测方法。
技术总结发音异常检测方法根据说话者的讲话数据计算声学特征量(S103),使用学习完毕的DNN(Deep Neural Network,深度神经网络),根据声学特征量,计算表示讲话数据的说话者属性的第一说话者特征量(S104),计算说话者的健全时的说话者特征量即第二说话者特征量与第一说话者特征量之间的相似度(S105),基于相似度,判定说话者的发音异常(S106~S108)。例如,也可以是,在发音异常的判定(S106~S108)中,在相似度低于预先确定的第一阈值的情况下,判定为说话者是发音异常。技术研发人员:大毛胜统,高畑翔吾,川见员令,长尾青空,大前瞭太受保护的技术使用者:松下控股株式会社技术研发日:技术公布日:2024/2/6本文地址:https://www.jishuxx.com/zhuanli/20240618/21532.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表