化学、生物与自动化实验室 突破级 暂无讲解视频
发表时间
2026-05-14
DOI
10.1038/s41467-026-73129-6

核心要点

问题/背景
这篇 Nature Communications 论文提出 SUCCEED,一个大规模监督多任务 DNA foundation model,目标是解决序列模型在不同基因组任务中需要反复重训、可扩展性不足的问题。
方法/机制
SUCCEED 在 6,389 条 ENCODE 功能基因组 tracks 上预训练,结合卷积层和 Transformer,同时捕捉局部序列 motif 与长程调控依赖。
结果/证据
论文报告通过迁移学习可预测细胞类型特异的表观基因组 profile、去噪稀疏染色质可及性数据,并在多类 benchmark 中达到或超过强基线。
收录价值
收录价值在于它是 DNA/regulatory foundation model 方向的高质量 Nature-family 漏项,直接关系到基因组解释和生物设计模型的可复用表征。

收录解读

这篇 Nature Communications 论文提出 SUCCEED,一个大规模监督多任务 DNA foundation model,目标是解决序列模型在不同基因组任务中需要反复重训、可扩展性不足的问题。

SUCCEED 在 6,389 条 ENCODE 功能基因组 tracks 上预训练,结合卷积层和 Transformer,同时捕捉局部序列 motif 与长程调控依赖。

论文报告通过迁移学习可预测细胞类型特异的表观基因组 profile、去噪稀疏染色质可及性数据,并在多类 benchmark 中达到或超过强基线。

收录价值在于它是 DNA/regulatory foundation model 方向的高质量 Nature-family 漏项,直接关系到基因组解释和生物设计模型的可复用表征。

论文摘要

The paper presents SUCCEED, a supervised multi-task DNA foundation model pretrained on 6,389 ENCODE functional genomics tracks to learn transferable regulatory representations across diverse genomics tasks.

相关论文

链接