IntentVLA: Short-Horizon Intent Modeling for Aliased Robot Manipulation

机器人与具身智能突破级暂无讲解视频

收录解读

IntentVLA 研究 VLA 操作中的 partial observability：相似当前画面可能来自不同任务阶段或短期意图，frame-conditioned chunk policies 会在相邻 replanning steps 重新采样不同 intent，导致执行不稳定。

方法用最近视觉历史编码 compact short-horizon intent representation，并将其作为 action chunk generation 的条件；同时提出 AliasBench，专门评估短时观察混叠下的机器人操作。

它值得正式收录，因为它把 VLA 的失败模式从简单感知误差细化为 short-horizon intent inconsistency，并给出训练框架和 benchmark。

它没有更高，是因为主要验证在仿真和现有 manipulation benchmarks；真实机器人、多模态传感和长程任务下仍需验证。