Accurate predictions of disordered protein ensembles with STARLING

化学、生物与自动化实验室突破级暂无讲解视频

发表时间: 2026-02-18
DOI: 10.1038/s41586-026-10141-2

收录解读

无序蛋白及无序区域并不是少数例外，而是细胞功能和分子识别中的核心组成部分。难点在于它们不对应单一稳定结构，而是跨越大范围构象 ensemble。传统计算方法往往要么精度不够，要么成本过高，很难支持大规模序列搜索、条件分析和快速设计。

STARLING 把 physics-based force fields 与 multi-modal generative deep learning 结合起来，从序列快速生成准确的 IDR ensembles 和 ensemble-aware 表征，并支持在不同离子强度等环境条件下建模。作者还加入 Bayesian maximum-entropy reweighting，用实验约束进一步 refinement；在此基础上，STARLING 既能做 biophysical look-alike 搜索，也能把 ensemble-first sequence design 从每个候选数小时或数周压到秒级。

对这个仓库来说，这篇论文的价值不在“又一个蛋白模型”，而在于它把无序蛋白研究从昂贵的逐个候选分析，推进到可扩展的 generative ensemble workflow。它明显属于 AI-driven biology / protein engineering 主线，并且对 sequence-to-ensemble modeling、条件生成和实验解释都有长期参考价值。

它暂时不再升一级，是因为当前工作虽然很强，但影响面仍主要集中在 intrinsically disordered proteins 这一子方向，还没有像更通用的 protein foundation model 那样改变更广泛的蛋白设计默认范式。

链接

论文链接