OpenAI · 评测
OpenAI 发布 SimpleQA 评测基准 SimpleQA
OpenAI 推出 SimpleQA,一个面向大语言模型的事实性评测基准。该基准包含数千道需简短回答的提问,覆盖多领域知识,旨在衡量模型回答的准确性与简洁性。SimpleQA 的发布为社区提供了一个更聚焦事实核查能力的评估工具,有助于推动模型在真实信息场景下的表现提升。
- 域名
openai.com- 评分
- 5 · 重大发布
- 发布
- 2026-05-04
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
