Causal Forcing++: Scalable Few-Step Autoregressive Diffusion Distillation for Real-Time Interactive Video Generation

生成建模与扩散突破级暂无讲解视频

发表时间: 2026-05-14
arXiv: 2605.15141

收录解读

Causal Forcing++ 针对 real-time interactive video generation 的低延迟瓶颈，把 autoregressive diffusion distillation 推到 frame-wise 1-2 sampling steps。

论文指出 few-step AR student initialization 是关键瓶颈，提出 causal consistency distillation，用单个 online teacher ODE step 学习 AR-conditional flow map，避免预计算完整 PF-ODE trajectories。

它值得正式收录，因为它为交互式视频/世界模型提供了更低延迟的可复用蒸馏流程，并把 first-frame latency 降低约 50%、Stage 2 训练成本降到约四分之一。

它没有更高，是因为它仍依赖特定 AR diffusion pipeline；真实交互世界模型中的长期一致性和控制复杂度仍需验证。

链接

论文链接代码代码代码