DeepMind · TTS

DeepMind 发布 WaveNet 原始音频生成模型

DeepMind 推出 WaveNet,一种直接对原始音频波形建模的生成模型。与传统的拼接式语音合成不同,WaveNet 通过自回归方式逐样本预测音频信号,能够生成更自然、更富有表现力的语音。该模型在英语和普通话的语音合成测试中均显著降低了自然度与听感上的差距,同时还可用于音乐生成和音频特效。WaveNet 的发布为语音合成领域带来了新的技术路径。

域名
deepmind.google
评分
5 · 重大发布
发布
2026-02-25

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。