化学、生物与自动化实验室
突破级
暂无讲解视频
收录解读
问题与背景:现有 genomic foundation models 主要依赖单核苷酸输入上的大规模神经计算去隐式学习生物 motif,但这种做法在效率和显式结构利用上都有明显限制。
方法/新意:Gengram 提出 retrieval-augmented genomic foundation model 思路,通过面向基因组多碱基 motif 的显式检索模块,把‘语法级’结构直接接到基础模型主干上。重点是把 motif lookup 变成第一类操作,而不是完全让网络自己逼近。
意义/放在仓库中的位置:这篇工作位于 genomics foundation model 主线,属于‘把检索增强从语言转移到生物序列’的代表作。它和 AlphaGenome、ELISA、LUMI-lab 一起构成当前 AI x 生物的强一线。
局限/为何不再升一级:目前仍是 arXiv 阶段,且影响面主要在基因组序列建模。它是很强的结构增强方法,但还未形成更大范围的范式改写。