化学、生物与自动化实验室
突破级
暂无讲解视频
核心要点
- 问题/背景
- 这篇 Nature Communications 论文提出 SUCCEED,一个大规模监督多任务 DNA foundation model,目标是解决序列模型在不同基因组任务中需要反复重训、可扩展性不足的问题。
- 方法/机制
- SUCCEED 在 6,389 条 ENCODE 功能基因组 tracks 上预训练,结合卷积层和 Transformer,同时捕捉局部序列 motif 与长程调控依赖。
- 结果/证据
- 论文报告通过迁移学习可预测细胞类型特异的表观基因组 profile、去噪稀疏染色质可及性数据,并在多类 benchmark 中达到或超过强基线。
- 收录价值
- 收录价值在于它是 DNA/regulatory foundation model 方向的高质量 Nature-family 漏项,直接关系到基因组解释和生物设计模型的可复用表征。
收录解读
这篇 Nature Communications 论文提出 SUCCEED,一个大规模监督多任务 DNA foundation model,目标是解决序列模型在不同基因组任务中需要反复重训、可扩展性不足的问题。
SUCCEED 在 6,389 条 ENCODE 功能基因组 tracks 上预训练,结合卷积层和 Transformer,同时捕捉局部序列 motif 与长程调控依赖。
论文报告通过迁移学习可预测细胞类型特异的表观基因组 profile、去噪稀疏染色质可及性数据,并在多类 benchmark 中达到或超过强基线。
收录价值在于它是 DNA/regulatory foundation model 方向的高质量 Nature-family 漏项,直接关系到基因组解释和生物设计模型的可复用表征。
论文摘要
The paper presents SUCCEED, a supervised multi-task DNA foundation model pretrained on 6,389 ENCODE functional genomics tracks to learn transferable regulatory representations across diverse genomics tasks.