机器人与具身智能 突破级 暂无讲解视频
发表时间
2026-05-14
arXiv
2605.14712

收录解读

IntentVLA 研究 VLA 操作中的 partial observability:相似当前画面可能来自不同任务阶段或短期意图,frame-conditioned chunk policies 会在相邻 replanning steps 重新采样不同 intent,导致执行不稳定。

方法用最近视觉历史编码 compact short-horizon intent representation,并将其作为 action chunk generation 的条件;同时提出 AliasBench,专门评估短时观察混叠下的机器人操作。

它值得正式收录,因为它把 VLA 的失败模式从简单感知误差细化为 short-horizon intent inconsistency,并给出训练框架和 benchmark。

它没有更高,是因为主要验证在仿真和现有 manipulation benchmarks;真实机器人、多模态传感和长程任务下仍需验证。

链接