Meta AI · ASR
Meta AI 发布 wav2vec 2.0 语音表示学习模型
Meta AI 公开了 wav2vec 2.0,一种从原始音频中直接学习语音结构的自监督模型。它无需人工标注的转录文本,仅通过大量未标注语音数据预训练,就能在下游语音识别任务中达到接近监督学习的性能。wav2vec 2.0 采用对比学习框架,将音频片段与对应的量化表示进行匹配,同时引入掩码预测机制,显著提升了低资源场景下的识别效果。这一工作为语音领域的大规模无监督预训练奠定了重要基础。
- 域名
ai.meta.com- 评分
- 4 · 重要更新
- 收录
- 2026-05-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。