arXiv · 评测

ESI-Bench 发布具身空间智能评测基准

ESI-Bench 是一个面向具身空间智能的评测基准，核心关注感知-行动闭环：智能体通过动作获取观测，并推理所需的观察，并理解观察随动作变化的规律。不同于传统被动感知任务，该基准要求模型主动探索场景中的遮挡结构、物体动态与空间关系与容器属性等。它填补了现有评测在闭环空间推理上的空白，为具身 agent 的空间理解能力提供了更贴近真实交互的衡量标准。

域名: arxiv.org
评分: 4 · 重要更新
发布: 2026-05-18

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

原文摘要

Spatial intelligence unfolds through a perception-action loop: agents act to acquire observations, and reason about how observations vary as a function of action. Rather than passively processing what is seen, they actively uncover what is unseen - occluded structure, dynamics, containment, and fun…

Back to Latest