OpenAI · 评测

OpenAI 发布 Swe Lancer 评估

OpenAI 推出 Swe Lancer,一个面向软件开发任务的评估框架,用于衡量模型在真实编程场景中的表现。该基准覆盖代码理解、调试与重构等维度,旨在推动 LLM 在软件工程领域的实用化进程。

域名
openai.com
评分
4 · 重要更新
发布
2026-04-06
OpenAI 发布 Swe Lancer 评估

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。