Beyond Protein Language Models: An Agentic LLM Framework for Mechanistic Enzyme Design

化学、生物与自动化实验室突破级暂无讲解视频

发表时间: 2025-11-24
arXiv: 2511.19423

收录解读

蛋白和酶设计里，语言模型已经能提供序列层面的启发，但从结构、静电环境到机制层的可解释假设生成仍然高度依赖专家。本文针对的是这个缺口：如何让 LLM 不只是生成候选序列，而是生成带机制解释、可实验检验的设计假设。

作者提出 Genie-CAT，一个带工具增强的 agentic LLM 框架，把文献检索、PDB 结构解析、电势计算和红氧性质预测整合进统一流程。以金属蛋白为例，系统能够在统一工作流里给出接近专家推理的、残基级别的机制假设，连接序列、结构与功能。

这篇论文适合仓库的 AI×生物与 agentic science 主线。它不像通用蛋白语言模型那样追求单一 benchmark，而是代表一种“LLM + physics/biochem tools” 的机制设计范式，对 enzyme design、hypothesis generation 和 mechanistic protein design 都有参考价值。

它暂时归为突破性，因为当前更像 proof-of-concept 与高质量框架论文，仍缺少更大规模实验闭环或真实 wet-lab 结果，暂不足以升到颠覆性。

链接

论文链接