MultiMAE for Brain MRIs: Robustness to Missing Inputs Using Multi-Modal Masked Autoencoder

神经科学与认知科学突破级暂无讲解视频

发表时间: 2025-09-14
arXiv: 2509.11442

收录解读

这篇论文处理的是脑 MRI 中最实际也最顽固的问题之一：不同中心、不同病人、不同临床流程下，输入序列经常缺失，导致依赖完整多序列输入的模型在真实环境中迅速退化。作者把问题从“给定完整输入如何做得更好”转成“在缺失输入是常态时如何预训练出稳健表征”。

方法上，论文把 MultiMAE 思路改造成 3D 脑 MRI 场景下的多模态 masked autoencoder：把不同 MRI 序列当作独立模态输入，用 late-fusion Transformer 编码，再用分流解码器对各模态做重建。核心新意不是简单多序列融合，而是把“跨序列推断缺失信息”的能力直接写进预训练目标，让编码器学会在序列不齐时仍维持有用表征。

它在仓库里的价值主要是脑影像 foundation model 路线的补强项。和 BrainIAC、Prima 这类更大、更临床的平台型系统相比，这篇更聚焦在“缺模态鲁棒性”这一现实瓶颈，但方法可迁移到其他多模态医学影像任务，因此仍值得正式收录。

我把它放在“突破性”。原因是它在脑 MRI 子方向上很实用，也有清晰方法贡献，但影响范围仍偏向特定模态鲁棒性问题，还不足以上升到会重排脑影像基础模型路线的更高等级。

链接

论文链接