Meta AI · 评测

Meta 发布 Dynabench 重新思考 AI 评测方法

Meta AI 推出 Dynabench 项目,旨在推动 AI 评测范式的根本变革。传统静态基准难以跟上模型能力演进,Dynabench 尝试建立动态、对抗性的评测流程,让研究人员在迭代中持续挑战现有模型,从而更真实地反映系统在实际交互中的表现。这一举措有望缓解基准饱和与过拟合问题,为社区提供更健壮的评估工具。

域名
ai.meta.com
评分
4 · 重要更新
收录
2026-05-19

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。