OpenAI · 评测

OpenAI 发布 SimpleQA 评测基准 SimpleQA

OpenAI 推出 SimpleQA，一个面向大语言模型的事实性评测基准。该基准包含数千道需简短回答的提问，覆盖多领域知识，旨在衡量模型回答的准确性与简洁性。SimpleQA 的发布为社区提供了一个更聚焦事实核查能力的评估工具，有助于推动模型在真实信息场景下的表现提升。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。