-
跨讲话者风格转移语音合成的制作方法
背景技术:1、文本到语音(tts)合成旨在基于文本输入来生成对应的语音波形。tts合成广泛地用于语音到语音翻译、对特定用户的语音定制、故事中的角色扮演等。传统的tts系统可以基于文本输入来预测声学特征......
-
话音活动检测集成以改进自动讲话检测的制作方法
背景技术:1、本文中的一个或多个实施例总体上涉及通常与话音(voice)活动检测(vad)模型一起部署以运行自动讲话(speech)识别(asr)的asr系统,并且更具体地涉及接收asr信息的递归神经......
-
讲话者识别方法、讲话者识别装置以及讲话者识别程序与流程
本公开涉及识别不特定讲话者的技术。背景技术:1、专利文献1公开了如下的技术:对输入模式的发生内容和标准模式的发生内容进行声音识别,基于得到的发生内容信息,求出输入模式和预先注册的多个注册讲话者的标准模......