生成建模与扩散 突破级 暂无讲解视频
发表时间
2026-05-20
arXiv
2605.21573

收录解读

Lens 关注 foundational text-to-image models 的训练效率,而不是单一 benchmark 或局部模块改进。

论文系统重构训练 recipe,涉及高质量 dense captions、多分辨率训练、语义 VAE、强化学习优化和蒸馏等环节。

这种工作对生成模型基础设施有价值,因为它把大规模 T2I 模型训练中的多项经验组合成可复用工程路径。

它值得正式收录,因为高效训练 recipe 会直接影响开源/工业 T2I 模型的成本曲线和可复现能力。

链接