arXiv · 评测
ESI-Bench 发布具身空间智能评测基准
ESI-Bench 是一个面向具身空间智能的评测基准,核心关注感知-行动闭环:智能体通过动作获取观测,并推理所需的观察,并理解观察随动作变化的规律。不同于传统被动感知任务,该基准要求模型主动探索场景中的遮挡结构、物体动态与空间关系与容器属性等。它填补了现有评测在闭环空间推理上的空白,为具身 agent 的空间理解能力提供了更贴近真实交互的衡量标准。
- 域名
arxiv.org- 评分
- 4 · 重要更新
- 发布
- 2026-05-18
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
原文摘要
Spatial intelligence unfolds through a perception-action loop: agents act to acquire observations, and reason about how observations vary as a function of action. Rather than passively processing what is seen, they actively uncover what is unseen - occluded structure, dynamics, containment, and fun…
