arXiv · Agent

arXiv 论文提出 Code as Agent Harness 框架

arXiv 一篇新论文提出 Code as Agent Harness,将代码定位为 agent 系统的操作接口而非仅最终产出。该框架让大语言模型通过编写和执行代码来驱动外部工具完成复杂任务,在多个基准上取得较好效果,为 agent 系统的实现提供了一种新的技术路径。

域名
arxiv.org
评分
4 · 重要更新
发布
2026-05-18
arXiv 论文提出 Code as Agent Harness 框架

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。

原文摘要

Recent large language models (LLMs) have demonstrated strong capabilities in understanding and generating code, from competitive programming to repository-level software engineering. In emerging agentic systems, code is no longer only a target output. It increasingly serves as an operational substr…