智能体与自主科学
突破级
暂无讲解视频
收录解读
DAWN 提出 World-Action Interactive Models,认为现有 WAM 往往把 world prediction 和 action generation 并行或串行分离,忽略动作与未来世界之间的 reciprocity。
它在自动驾驶中实现一个 latent generative baseline:World Predictor 预测未来 latent world,World-Conditioned Action Denoiser 生成动作,再把动作反馈给世界预测器,在推理时递归更新。
它值得正式收录,因为它给 action-contingent world modeling 提供了清晰问题定义和短 rollout latent architecture,是 embodied world/action model 的重要 framing。
它没有更高,是因为实证主要集中于 autonomous driving planning;是否能迁移到通用机器人操作和更开放环境还有待验证。