DeepMind · 评测

DeepMind 发布 Facts Grounding 基准,评估大模型事实性

DeepMind 推出 Facts Grounding 新基准,专门用于评估大语言模型的事实准确性。该基准通过构建包含真实世界事实的问答对,系统性地衡量模型在生成内容时的事实幻觉程度。与以往依赖人工评估或自动对比的方式不同,Facts Grounding 强调对知识边界的细粒度检验,能更精确地反映模型在不确定问题上的表现。这一工具为提升模型可靠性和安全部署提供了重要评估手段。

域名
deepmind.google
评分
4 · 重要更新
发布
2026-03-03

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。