OpenAI · 评测

OpenAI 发布 Swe Lancer 评估

OpenAI 推出 Swe Lancer，一个面向软件开发任务的评估框架，用于衡量模型在真实编程场景中的表现。该基准覆盖代码理解、调试与重构等维度，旨在推动 LLM 在软件工程领域的实用化进程。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。