Multiomics and deep learning dissect regulatory syntax in human development

化学、生物与自动化实验室突破级暂无讲解视频

发表时间: 2026-04-08
DOI: 10.1038/s41586-026-10326-9

收录解读

理解人类发育过程中顺式调控元件如何工作，长期受限于数据粒度和建模接口两端都不够完整。一方面，发育期单细胞层面的染色质开放性与基因表达图谱长期碎片化，难以支撑跨器官、跨细胞类型的统一比较；另一方面，很多序列模型虽然能做局部预测，却难以把 motif 组合规则、协同约束和变异效应解释组织成真正可复用的 regulatory syntax 资源。

这篇工作的核心不只是做了一个大 atlas，而是把单细胞 multiomics 与 sequence-to-accessibility deep learning 接成了一条完整的建模链路。作者构建了覆盖 12 个器官、81.7 万 fetal cells 的 Human Development Multiomic Atlas，并训练从局部 DNA 序列预测可及性的深度学习模型，用来系统解析影响 accessibility 的 motif 词汇表、复合 motif 的 spacing/orientation 约束，以及正负调控规则对基因表达的影响。模型解释层进一步把 variant disruption 与 gene-expression effect 对齐，使其不止是黑盒预测器。

这篇论文值得正式收录，因为它把 AI 在发育基因调控中的角色从“辅助做一个序列分类器”推进到“建立可查询、可解释、可迁移的 regulatory syntax layer”。对仓库来说，真正有价值的不是又一个 genomics benchmark，而是这种把多组学资源、序列建模、规则抽取和变异解释连接起来的 durable modeling interface。它对发育生物学、疾病变异解释、增强子逻辑研究和后续 foundation-style regulatory modeling 都有明显外溢。

它暂时不升到更高一级，因为当前重点仍集中在 human development 语境下的 cis-regulatory logic 解析，还没有进一步走到更通用的跨物种 regulatory foundation model、实验闭环设计平台或端到端干预优化 workflow。它非常强，但更像一层高价值基础建模与资源平台，而不是已经重排整个 AI-for-biology 工作流的范式级系统。

链接

论文链接