生成建模与扩散
突破级
暂无讲解视频
收录解读
Lens 关注 foundational text-to-image models 的训练效率,而不是单一 benchmark 或局部模块改进。
论文系统重构训练 recipe,涉及高质量 dense captions、多分辨率训练、语义 VAE、强化学习优化和蒸馏等环节。
这种工作对生成模型基础设施有价值,因为它把大规模 T2I 模型训练中的多项经验组合成可复用工程路径。
它值得正式收录,因为高效训练 recipe 会直接影响开源/工业 T2I 模型的成本曲线和可复现能力。