Not Quite Anything: Overcoming SAMs Limitations for 3D Medical Imaging

数学与形式推理突破级暂无讲解视频

发表时间: 2025-11-22
arXiv: 2511.19471

收录解读

这篇论文讨论通用分割基础模型在 3D 医学影像上的失配问题。SAM/SAM-2 在自然图像上很强，但在脑 MRI 这类低对比、边界模糊的 3D 医学场景里效果明显下降。论文想解决的不是再训练一个更大的专用模型，而是如何让现有 foundation segmentation 模型真正适配 3D 医学图像。

方法上，作者没有直接微调整个 foundation model，而是采用组合式框架：用轻量 3D U-Net 产生粗定位，再把 foundation model 输出作为额外输入通道，与 MRI 一起进行分割，并探索了基于 DINO attention 的 prompt-free 变体。关键思想是把 foundation model 作为组合模块，而不是端到端重训。

这篇适合放在医学影像 / foundation model 适配主线。它的价值是把“大模型如何进入 3D 医学影像”这件事做得更务实，说明在强领域偏移场景下，组合式适配可能比直接微调基础模型更有效。

它没有升到更高一级，因为外溢主要集中在 3D 医学分割这一子方向，更多是强工程和强适配思路，而不是改变更广泛视觉基础模型路线的论文。

链接

论文链接