AnyFlow: Any-Step Video Diffusion Model with On-Policy Flow Map Distillation

生成建模与扩散突破级暂无讲解视频

发表时间: 2026-05-13
arXiv: 2605.13724

收录解读

AnyFlow 针对 few-step video diffusion 的一个关键缺陷：consistency distillation 在少步采样时有效，但随着测试时步数增加反而可能退化，因为它替换了原始 probability-flow ODE trajectory，破坏了 ODE sampling 的 test-time scaling 行为。

论文把蒸馏目标从 endpoint consistency mapping 改成 flow-map transition learning，在任意时间区间学习 z_t 到 z_r 的转移，并提出 Flow Map Backward Simulation，把完整 Euler rollout 分解成 shortcut flow-map transitions，做更高效的 on-policy distillation。

它值得正式收录，因为它为视频生成提供了 any-step distillation primitive：同一个蒸馏模型既能低步快速生成，也能随采样预算增加而继续受益。论文在 1.3B 到 14B、双向和因果视频架构上验证，且代码、模型和 demo 已公开。

它没有更高，是因为它仍处在视频 diffusion distillation 子方向，是否会成为通用视频生成后训练标准，还要看更多基础模型、长视频、可控生成和真实部署延迟上的复现。

链接

论文链接项目代码代码