化学、生物与自动化实验室
突破级
有讲解视频
收录解读
这篇论文解决的是合成生物学和基因调控设计中的核心问题:如何系统地设计紧凑、细胞类型特异的调控元件。它不是把生成模型简单套到序列上,而是把生成式 AI 直接嵌入到 regulatory design workflow,并做了实验级验证。
DNA-Diffusion 使用不同细胞系的 DNA accessibility 数据训练生成模型,直接产出 200bp 级别的合成调控元件。作者不仅检验了生成序列的转录因子结合语法和细胞类型特异性,还用大规模 STARR-seq 和 EXTRA-seq 验证了功能效果,甚至展示了对内源基因的调控。
它值得正式收录,是因为这是生成式 AI 在基因调控设计中的强工作流条目:模型、设计目标、实验验证和内源调控演示形成了完整闭环。相比很多“生成序列然后做少量验证”的论文,这篇更接近真正可复用的 biological design pattern。
它没有升到更高等级,是因为应用边界仍然集中在 regulatory element design,虽然外溢很强,但还没有到会重构更广泛生命科学基础模型路线的层级。