Meta AI · 训练

Meta 发布 Wikimatrix 多语言平行语料库

Meta 推出 Wikimatrix,一个基于维基百科对大规模多语言平行语料库。该数据集覆盖超过 1500 种语言,通过自动对齐维基百科文章标题和文本生成高质量翻译对,可用于机器翻译和跨语言模型训练。Wikimatrix 的规模与语种覆盖远超此前公开数据集,为低资源语言研究提供了重要基础。

域名
ai.meta.com
评分
4 · 重要更新
收录
2026-05-19

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。