Dual-encoder contrastive learning accelerates enzyme discovery

化学、生物与自动化实验室突破级暂无讲解视频

发表时间: 2026-03-17

收录解读

酶工程里的核心瓶颈往往不在后续定向进化本身，而在于能否先从巨大蛋白空间里找到值得起步的候选酶。很多机器学习工作能做局部打分，但真正把反应需求映射到可实验验证的 enzyme recommendation，并在大规模数据和真实实验里证明有效，门槛一直很高。

这篇论文提出 Horizyn-1，用 dual-encoder contrastive learning 把 reaction fingerprint 与 protein language model 表征接到同一个推荐框架里，在数百万 reaction-enzyme pairs 上训练，实现大规模 reaction-to-enzyme retrieval。它的关键不是单一 benchmark 提升，而是把推荐结果直接推到实验层面，覆盖 orphan reactions、酶 promiscuity 预测，以及非天然生化反应的酶发现，并展示少样本 fine-tuning 对稀缺反应类的快速增益。

它值得正式收录，因为这不是普通的 biocatalysis predictor，而是一种可复用的 enzyme discovery workflow：给定反应，先在大规模酶空间里高召回检索，再把结果转入实验验证和后续优化。对 AI x chemistry / synthetic biology / enzyme engineering 来说，这种 reaction-to-enzyme recommendation interface 有明确外溢，也和仓库当前对 AI 驱动科学发现工作流的重点方向一致。

它目前仍然是 breakthrough，而不是更高一级，因为虽然实验验证很重要，但方法主轴仍然集中在 enzyme sourcing 这一层，而不是更完整的药物发现或多步生物合成闭环。它证明了一个强有力的 discovery primitive，但要上升到更高层级，还需要更广泛的工业级采用、跨家族泛化和与下游 design-build-test loops 的深度整合。

链接

论文链接