化学、生物与自动化实验室 突破级 暂无讲解视频
发表时间
2026-04-01
DOI
10.1038/s42256-026-01210-2

收录解读

单序列蛋白结构预测的重要性持续上升,因为很多蛋白缺乏足够同源信息,而传统依赖 MSA 或模板的路线在这些场景下成本高、覆盖差。这篇论文瞄准的就是如何在不依赖同源信息的情况下,仍然高效地得到高质量结构预测。

作者提出 TDFold,用二维几何模板扩散先生成成对距离和方向等 pairwise geometries,再结合 sequence-geometry collaborative learning 推断三维结构。它把扩散模型用在 2D 几何模板层,而不是直接在 3D 结构空间硬做生成,这使得单序列输入下的结构归纳更稳定,也形成了一个不同于现有 protein language model 路线的接口设计。

这篇工作值得收录,因为它不是简单刷新单一 benchmark,而是在单序列 protein folding 上给出了一条更清晰的可复用方法路径:先生成高质量 2D 几何模板,再高效折叠到 3D。对资源受限环境、同源稀缺蛋白,以及更广的 AI x biology 结构建模都有现实意义。

它没有升到更高一级,是因为其影响目前仍主要集中在蛋白结构预测子线,且长期地位还要看后续外部复现、与主流基础模型路线的结合程度,以及在更复杂结构生物学任务中的延展性。

链接