DeepMind · TTS

DeepMind 发布 WaveNet 语音合成模型

DeepMind 推出 WaveNet，一种基于深度神经网络的原始音频波形生成模型。WaveNet 能够直接对语音信号进行建模，生成比传统参数合成和拼接合成更自然、更流畅的语音。该模型通过自回归方式逐样本预测音频，在多个语种的语音合成任务中显著降低了自然度与人类语音的差距，为 TTS 领域带来了突破性进展。

域名: deepmind.google
评分: 5 · 重大发布
发布: 2025-10-27

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest