OpenAI · 评测

OpenAI 发布 SimpleQA 评测基准 SimpleQA

OpenAI 推出 SimpleQA,一个面向大语言模型的事实性评测基准。该基准包含数千道需简短回答的提问,覆盖多领域知识,旨在衡量模型回答的准确性与简洁性。SimpleQA 的发布为社区提供了一个更聚焦事实核查能力的评估工具,有助于推动模型在真实信息场景下的表现提升。

域名
openai.com
评分
5 · 重大发布
发布
2026-05-04
OpenAI 发布 SimpleQA 评测基准 SimpleQA

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。