DISK: Dynamic Inference SKipping for World Models

科学发现旗舰工作突破级暂无讲解视频

发表时间: 2026-01-31
arXiv: 2602.00440

收录解读

这篇论文处理的是世界模型落地时很实际的一层问题：闭环视频和轨迹预测往往太慢，尤其在自动驾驶这种长时 rollout 场景下，扩散式世界模型的推理成本会迅速变成瓶颈。作者试图在不重新训练模型的前提下，做出真正可用的推理加速。

方法上，DISK 是一个 training-free 的动态跳步推理方法，用两个耦合的控制器分别对视频扩散和轨迹扩散分支做 skip 决策，同时把控制统计传播到 autoregressive rollout 里，保证长时稳定性。它的价值不在重训新模型，而在 test-time 层面对世界模型做自适应加速。

它适合放在仓库里，是因为我们已经收了不少 world model 与 VLA 方向的基础模型和闭环策略论文，而 DISK 补上了“如何让这些模型在实际推理预算下工作”的系统层空白。对于自动驾驶和通用世界模型部署都很有参考意义。

我把它归为“突破性”。原因是它是高质量系统论文，结果也实用，但主要作用在推理效率与部署层，还不是重新定义世界模型训练范式的工作。

链接

论文链接