arXiv · 评测

ESI-Bench 发布具身空间智能评测基准

ESI-Bench 是一个面向具身空间智能的评测基准,核心关注感知-行动闭环:智能体通过动作获取观测,并推理所需的观察,并理解观察随动作变化的规律。不同于传统被动感知任务,该基准要求模型主动探索场景中的遮挡结构、物体动态与空间关系与容器属性等。它填补了现有评测在闭环空间推理上的空白,为具身 agent 的空间理解能力提供了更贴近真实交互的衡量标准。

域名
arxiv.org
评分
4 · 重要更新
发布
2026-05-18
ESI-Bench 发布具身空间智能评测基准

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。

原文摘要

Spatial intelligence unfolds through a perception-action loop: agents act to acquire observations, and reason about how observations vary as a function of action. Rather than passively processing what is seen, they actively uncover what is unseen - occluded structure, dynamics, containment, and fun…