科学发现旗舰工作
突破级
暂无讲解视频
收录解读
这篇论文处理的是世界模型落地时很实际的一层问题:闭环视频和轨迹预测往往太慢,尤其在自动驾驶这种长时 rollout 场景下,扩散式世界模型的推理成本会迅速变成瓶颈。作者试图在不重新训练模型的前提下,做出真正可用的推理加速。
方法上,DISK 是一个 training-free 的动态跳步推理方法,用两个耦合的控制器分别对视频扩散和轨迹扩散分支做 skip 决策,同时把控制统计传播到 autoregressive rollout 里,保证长时稳定性。它的价值不在重训新模型,而在 test-time 层面对世界模型做自适应加速。
它适合放在仓库里,是因为我们已经收了不少 world model 与 VLA 方向的基础模型和闭环策略论文,而 DISK 补上了“如何让这些模型在实际推理预算下工作”的系统层空白。对于自动驾驶和通用世界模型部署都很有参考意义。
我把它归为“突破性”。原因是它是高质量系统论文,结果也实用,但主要作用在推理效率与部署层,还不是重新定义世界模型训练范式的工作。