OpenAI · 评测

OpenAI 发布 Gdpval 评测基准

OpenAI 推出 Gdpval,一个面向大语言模型的新型评测基准。该基准旨在更全面地评估模型在复杂推理、多步规划和事实一致性等方面的能力,弥补现有评测指标在深度和实用性上的不足。Gdpval 的发布为行业提供了更严格的模型能力衡量标准,有望推动模型在真实世界任务中的表现提升。

域名
openai.com
评分
5 · 重大发布
发布
2026-05-15

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。