OpenAI · 浏览器自动化

OpenAI 发布 BrowseComp 浏览器自动化基准测试

OpenAI 推出 BrowseComp,一个面向浏览器自动化 agent 的基准测试。该测试评估 agent 在真实网页环境中完成复杂多步任务的能力,涵盖信息检索、表单填写、多页面导航等场景。BrowseComp 的发布为衡量和比较不同浏览器自动化方案提供了标准化评测手段,有助于推动该领域的技术进步。

域名
openai.com
评分
4 · 重要更新
发布
2026-04-06
OpenAI 发布 BrowseComp 浏览器自动化基准测试

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。