Meta AI · ASR

Meta AI 发布 wav2vec 2.0 语音表示学习模型

Meta AI 公开了 wav2vec 2.0，一种从原始音频中直接学习语音结构的自监督模型。它无需人工标注的转录文本，仅通过大量未标注语音数据预训练，就能在下游语音识别任务中达到接近监督学习的性能。wav2vec 2.0 采用对比学习框架，将音频片段与对应的量化表示进行匹配，同时引入掩码预测机制，显著提升了低资源场景下的识别效果。这一工作为语音领域的大规模无监督预训练奠定了重要基础。

域名: ai.meta.com
评分: 4 · 重要更新
收录: 2026-05-19

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest