化学、生物与自动化实验室 颠覆级 暂无讲解视频
发表时间
2025-09-08
DOI
10.1038/s42256-025-01103-w

收录解读

蛋白工程的核心瓶颈一直是实验搜索空间过大:单点突变还能穷举,多位点组合一旦展开,湿实验成本和迭代速度都会迅速失控。这篇论文正面解决的是“如何把实验蛋白工程变成可持续、可加速的主动探索过程”,而不是只再做一个更准的序列打分器。

论文把 fitness landscape modelling 和 reinforcement learning 结合起来,形成面向实验迭代的闭环:模型不只预测当前序列的优劣,还主动决定下一轮该探索哪里,从而在有限实验预算下更快找到高性能变体。这个 framing 的关键在于,它把 protein engineering 从静态筛选问题改写成 sequential decision-making 问题。

这篇论文值得高于普通 breakthrough,因为它给出了蛋白工程中很强的可复用模式:代理模型、实验回传、策略更新和多轮探索统一在一个可迭代回路里。对 protein engineering、enzyme optimization、directed evolution 甚至更广的实验设计型 AI for science 都有明显外溢。

它还没有升到 paradigm,原因是适用性和通用性仍需在更多蛋白家族、更多性质目标和更复杂实验条件下进一步证明。但作为把 RL 明确推进到实验蛋白工程闭环里的代表工作,它已经足够 disruptive。

链接