讲话 - 技术新讯

跨讲话者风格转移语音合成的制作方法

背景技术：1、文本到语音(tts)合成旨在基于文本输入来生成对应的语音波形。tts合成广泛地用于语音到语音翻译、对特定用户的语音定制、故事中的角色扮演等。传统的tts系统可以基于文本输入来预测声学特征......

2024-06-21 22

背景技术：1、本文中的一个或多个实施例总体上涉及通常与话音(voice)活动检测(vad)模型一起部署以运行自动讲话(speech)识别(asr)的asr系统，并且更具体地涉及接收asr信息的递归神经......

2024-06-21 48

本公开涉及识别不特定讲话者的技术。背景技术：1、专利文献1公开了如下的技术：对输入模式的发生内容和标准模式的发生内容进行声音识别，基于得到的发生内容信息，求出输入模式和预先注册的多个注册讲话者的标准模......

2024-06-21 52