网易有道发布开源TTS引擎子曰4.0,支持14语种无口音克隆

2026年6月23日,网易有道正式推出第四代语音合成引擎‘子曰4.0’(Confucius4-TTS)。该模型为业内首个支持14种语言跨语种无口音、零样本语音克隆的开源TTS系统。用户仅需3秒音频即可完成音色克隆,相似度超85%,准确率达97%。其创新音频Prompt情感迁移技术可复刻语调与韵律,底层采用GPT式大模型与Flow Matching框架。模型已全量开源(Apache协议),提供54GB离线部署包,适用于多语种内容生成、数字人配音及全球化传播。

上一篇:

下一篇:

发表回复

登录后才能评论