化学、生物与自动化实验室 突破级 暂无讲解视频
发表时间
2026-05-25
arXiv
2507.00087

收录解读

这篇 Nature Machine Intelligence 论文把质谱蛋白质组解析从多个分散工具推进到统一的 multimodal foundational model。

pUniFind 在超过 100 million open search-derived spectra 上训练,通过 spectral 和 peptide modalities 的 cross-modality prediction 统一 peptide-spectrum scoring、database search 和 zero-shot de novo sequencing。

在 immunopeptidomics 中,它报告 identified peptides 增加 42.6%;在 modification-rich de novo sequencing 中,在 300 倍更大搜索空间下比现有方法多识别 60% peptide-spectrum matches,并配套质量控制模块提升与 RNA-seq 证据的一致性。

它值得正式收录,因为它把 AI 直接嵌入蛋白质组学核心分析工作流,提供开放模型、数据和软件,而不是单一属性预测或狭窄分类器。

链接