生成建模与扩散
突破级
暂无讲解视频
收录解读
AnyFlow 针对 few-step video diffusion 的一个关键缺陷:consistency distillation 在少步采样时有效,但随着测试时步数增加反而可能退化,因为它替换了原始 probability-flow ODE trajectory,破坏了 ODE sampling 的 test-time scaling 行为。
论文把蒸馏目标从 endpoint consistency mapping 改成 flow-map transition learning,在任意时间区间学习 z_t 到 z_r 的转移,并提出 Flow Map Backward Simulation,把完整 Euler rollout 分解成 shortcut flow-map transitions,做更高效的 on-policy distillation。
它值得正式收录,因为它为视频生成提供了 any-step distillation primitive:同一个蒸馏模型既能低步快速生成,也能随采样预算增加而继续受益。论文在 1.3B 到 14B、双向和因果视频架构上验证,且代码、模型和 demo 已公开。
它没有更高,是因为它仍处在视频 diffusion distillation 子方向,是否会成为通用视频生成后训练标准,还要看更多基础模型、长视频、可控生成和真实部署延迟上的复现。