World Action Models are Zero-shot Policies

Seonghyeon Ye; Yunhao Ge; Kaiyuan Zheng; Shenyuan Gao; Sihyun Yu; George Kurian; Suneel Indupuru; You Liang Tan; Chuning Zhu; Jiannan Xiang; Ayaan Malik; Kyungmin Lee; William Liang; Nadun Ranawaka; Jiasheng Gu; Yinzhen Xu; Guanzhi Wang; Fengyuan Hu; Avnish Narayan; Johan Bjorck; Jing Wang; Gwanghyun Kim; Dantong Niu; Ruijie Zheng; Yuqi Xie; Jimmy Wu; Qi Wang; Ryan Julian; Danfei Xu; Yilun Du; Yevgen Chebotar; Scott Reed; Jan Kautz; Yuke Zhu; Linxi "Jim" Fan; Joel Jang

强化学习颠覆级有讲解视频

发表时间: 2026-02-17
arXiv: 2602.15922

收录解读

这篇论文提出 World Action Model 路线，把机器人策略从典型 VLA 的观察-语言-动作映射转向同时建模未来世界状态和动作。对本仓库来说，它的关键价值不是单个机器人 benchmark，而是 embodied AI 中 world model 与 action generation 的统一接口。

DreamZero 基于预训练视频 diffusion backbone，把视频预测的世界动态知识转化为 zero-shot policies，并在跨 embodiment、跨任务控制中展示能力。系统主张通过生成未来视频帧和动作序列，让模型在没有任务特定策略训练的情况下直接产生可执行控制。

它值得正式收录，是因为它是机器人世界模型方向的强代表：把视频生成模型的物理动态先验显式接入动作选择，对 VLA、具身泛化、zero-shot control 和世界模型评估都有很强外溢。

它没有升到 paradigm，是因为真实机器人部署、长时稳定性、实时性、失败恢复和大规模任务覆盖仍需要独立验证；当前更像强烈改变问题处理方式的 disruptive 系统原型。

解读视频

视频观看页 B 站 YouTube

链接

论文链接

收录解读

解读视频

相关论文

链接