生成建模与扩散
突破级
暂无讲解视频
收录解读
问题与背景:连续扩散在图像等模态上很强,但在语言建模中长期落后于离散扩散和自回归模型,核心难点来自稀疏 token 空间、评价方式不统一和训练设计不足。
方法与新意:LangFlow 把 embedding-space diffusion language models 与 Flow Matching 通过 Bregman divergence 连接起来,并提出 ODE-based NLL bound、information-uniform noise schedule 和适合连续语言扩散的 self-conditioning。
收录意义:这篇对生成建模主线有价值,因为它不是单纯刷榜,而是补上连续语言扩散的评估与训练设计缺口,给出“连续 diffusion 也能接近离散 DLM”的明确证据。
局限:结果仍主要在中等规模语言建模与 transfer benchmark 上,尚未证明可替代大规模自回归 LLM,也缺少大规模 post-training、tool use 或长上下文行为验证。