生成建模与扩散
突破级
暂无讲解视频
收录解读
Causal Forcing++ 针对 real-time interactive video generation 的低延迟瓶颈,把 autoregressive diffusion distillation 推到 frame-wise 1-2 sampling steps。
论文指出 few-step AR student initialization 是关键瓶颈,提出 causal consistency distillation,用单个 online teacher ODE step 学习 AR-conditional flow map,避免预计算完整 PF-ODE trajectories。
它值得正式收录,因为它为交互式视频/世界模型提供了更低延迟的可复用蒸馏流程,并把 first-frame latency 降低约 50%、Stage 2 训练成本降到约四分之一。
它没有更高,是因为它仍依赖特定 AR diffusion pipeline;真实交互世界模型中的长期一致性和控制复杂度仍需验证。