化学、生物与自动化实验室

Generalizable mutation-effect prediction across adaptive immune recognition via unified multimodal framework

发表：2026-05-27 · 突破级

这篇 Nature Machine Intelligence 论文提出 UniAIR，用统一的多模态框架预测抗体、抗原、TCR-pHLA 等自适应免疫识别场景中的突变效应，目标不是单一预测器，而是跨任务、跨模态的免疫识别基础方法。方法上，UniAIR 组合标准化数据管线、面向界面的序列-结构融合 Transf...

Hierarchical Multi-agent Large Language Model Reasoning for Autonomous Heterogeneous Catalyst Discovery

发表：2026-05-25 · 突破级

这篇 npj Computational Materials 论文把 LLM agents 用到异相催化发现，而不是只做文献问答或自动脚本执行。 MASTER 将自然语言推理、multi-agent collaboration 和 density functional theory workflows 连接起来...

SciCore-Mol: Augmenting Large Language Models with Pluggable Molecular Cognition Modules

发表：2026-05-21 · 突破级

SciCore-Mol 针对科学 LLM 处理分子数据时的结构性问题：把拓扑分子和连续反应信息压成离散文本会造成信息损失和语义噪声。框架把 topology-aware perception、latent diffusion-based molecular generation 和 reaction-awar...

Molecular deep learning at the edge of chemical space

发表：2026-04-22 · 突破级

这篇论文抓住了分子机器学习里一个长期但经常被低估的问题：模型在训练分布边缘之外往往迅速失真，但很多工作只报告平均测试集性能，几乎不显式刻画“离训练化学空间有多远时还可信”。作者的重点不是再做一个 predictor，而是为 chemical-space generalization 引入更可用的估计量。方法上...

Genome modelling and design across all domains of life with Evo 2

发表：2026-02-19 · 颠覆级

问题与背景：这篇论文试图把基因组建模从局部任务模型提升为跨生命全域的统一基础模型。传统基因组模型通常只覆盖特定物种、特定长度或特定任务，而 Evo 2 的目标是同时覆盖细菌、古菌和真核生物序列，并把预测与设计放进同一框架。方法/新意：论文提出 Evo 2 这一大规模基因组 foundation model，使...

LUMI-lab: A foundation model-driven autonomous platform enabling discovery of ionizable lipid designs for mRNA delivery

发表：2026-02-01 · 颠覆级

问题与背景：离子化脂质是 mRNA 递送系统的核心部件，但其设计空间极大，传统依赖人工经验和低通量筛选，导致发现速度慢、成本高。LUMI-lab 试图把 foundation model、实验自动化与闭环优化结合起来，解决脂质设计中的组合爆炸问题。方法/新意：这项工作构建了一个由基础模型驱动的自主实验平台，将...

QUASAR: A Universal Autonomous System for Atomistic Simulation and a Benchmark of Its Capabilities

发表：2026-01-30 · 颠覆级

- 分级：`颠覆性` - 正式标题：`QUASAR: A Universal Autonomous System for Atomistic Simulation and a Benchmark of Its Capabilities` - 原文：`2026-01-30-C2_QUASAR-QUASAR_A_U...

Computational design of metallohydrolases

发表：2026-01-29 · 颠覆级

问题与背景：金属水解酶能够催化生物体系中最困难的一类水解反应，但从头设计高活性金属酶一直非常困难，过去往往活性偏低、需要大量定向进化补救。论文聚焦的核心问题是：能否直接从计算设计出具有真实高催化效率的 metallohydrolases，而不是停留在概念验证层面。方法/新意：作者引入 RFdiffusion2...

Collective intelligence for AI-assisted chemical synthesis

发表：2026-01-19 · 颠覆级

- 分级：`颠覆性` - 正式标题：`Collective intelligence for AI-assisted chemical synthesis` - 原文：`2026-01-19-C1_MOSAIC-Collective_intelligence_for_AI_assisted_chemical_s...

Atom-level enzyme active site scaffolding using RFdiffusion2

发表：2025-12-03 · 颠覆级

问题与背景：酶设计通常从过渡态周围的催化官能团理想几何出发，但现有 AI 方法往往要求预先指定残基位置或从侧链反推主链，限制了活性位设计自由度。方法与机制：RFdiffusion2 直接从 functional group geometry 生成可放置活性位的蛋白支架，不需要指定残基顺序，也避免了逆 rota...

Computational enzyme design by catalytic motif scaffolding

发表：2025-12-03 · 颠覆级

这篇论文处理的是蛋白设计里一个最硬的问题之一：如何不再只设计稳定折叠蛋白，而是直接为明确的催化基元构建高活性酶。传统 de novo enzyme design 往往需要筛大量候选，初始活性也偏低，离工业或化学生物应用还有很长距离。作者把问题重构为 catalytic motif scaffolding，并用生...

Deep generative classification of blood cell morphology

发表：2025-11-19 · 颠覆级

- 分级：`颠覆性` - 正式标题：`Deep generative classification of blood cell morphology` - 原文：`2025-11-19-C3_CytoDiffusion-Deep_generative_classification_of_blood_cell_m...

Semantic design of functional de novo genes from a genomic language model

发表：2025-11-19 · 颠覆级

问题与背景：基因组生成模型正在变强，但如何控制模型生成具有指定功能、且远离天然序列空间的新基因仍是关键瓶颈。方法与机制：论文利用 Evo genomic language model 的上下文学习能力，把编码目标功能的 DNA prompt 作为 genomic autocomplete 条件，执行 sema...

Nicheformer: a foundation model for single-cell and spatial omics

发表：2025-10-30 · 突破级

问题与背景：组织功能依赖细胞局部微环境，但只用 dissociated single-cell 数据训练的模型难以恢复空间上下文。论文聚焦于把空间单细胞组学纳入 foundation model 预训练。方法与机制：Nicheformer 是 transformer-based foundation mode...

Deep-learning-based virtual screening of antibacterial compounds

发表：2025-10-24 · 颠覆级

这篇论文处理的是 AI drug discovery 里最硬的一类问题：如何把高成本、高噪声的湿实验筛选，扩展为真正可在超大化学空间上运行的深度学习虚拟筛选流程。抗菌药物发现尤其困难，因为活性分子稀缺、化学空间巨大、而且命中率通常极低，导致传统高通量筛选既昂贵又扩展性差。论文用约两百万分子的高通量筛选数据训练...

A multimodal robotic platform for multi-element electrocatalyst discovery

发表：2025-09-23 · 颠覆级

- 分级：`颠覆性` - 正式标题：`A multimodal robotic platform for multi-element electrocatalyst discovery` - 原文：`2025-09-23-C4_CRESt-A_multimodal_robotic_platform_for_mu...

Accelerating protein engineering with fitness landscape modelling and reinforcement learning

发表：2025-09-08 · 颠覆级

蛋白工程的核心瓶颈一直是实验搜索空间过大：单点突变还能穷举，多位点组合一旦展开，湿实验成本和迭代速度都会迅速失控。这篇论文正面解决的是“如何把实验蛋白工程变成可持续、可加速的主动探索过程”，而不是只再做一个更准的序列打分器。论文把 fitness landscape modelling 和 reinforce...

Scalable emulation of protein equilibrium ensembles with generative deep learning

发表：2025-08-14 · 颠覆级

这篇 Science 论文处理的是蛋白质建模里一个比单结构预测更困难的问题：如何高效近似蛋白质的平衡构象分布，也就是 protein equilibrium ensembles。传统分子动力学虽然能给出动态分布，但成本极高，难以大规模覆盖；而只预测单一静态结构又不足以刻画真实功能相关的构象变化。论文提出用生成...