DeepMind · TTS

DeepMind 发布 WaveNet 语音合成模型

DeepMind 推出 WaveNet,一种基于深度神经网络的原始音频波形生成模型。WaveNet 能够直接对语音信号进行建模,生成比传统参数合成和拼接合成更自然、更流畅的语音。该模型通过自回归方式逐样本预测音频,在多个语种的语音合成任务中显著降低了自然度与人类语音的差距,为 TTS 领域带来了突破性进展。

域名
deepmind.google
评分
5 · 重大发布
发布
2025-10-27

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。