生成建模与扩散 突破级 暂无讲解视频
发表时间
2026-05-14
arXiv
2605.15141

收录解读

Causal Forcing++ 针对 real-time interactive video generation 的低延迟瓶颈,把 autoregressive diffusion distillation 推到 frame-wise 1-2 sampling steps。

论文指出 few-step AR student initialization 是关键瓶颈,提出 causal consistency distillation,用单个 online teacher ODE step 学习 AR-conditional flow map,避免预计算完整 PF-ODE trajectories。

它值得正式收录,因为它为交互式视频/世界模型提供了更低延迟的可复用蒸馏流程,并把 first-frame latency 降低约 50%、Stage 2 训练成本降到约四分之一。

它没有更高,是因为它仍依赖特定 AR diffusion pipeline;真实交互世界模型中的长期一致性和控制复杂度仍需验证。

链接