数学与形式推理 突破级 暂无讲解视频
发表时间
2025-11-22
arXiv
2511.19471

收录解读

这篇论文讨论通用分割基础模型在 3D 医学影像上的失配问题。SAM/SAM-2 在自然图像上很强,但在脑 MRI 这类低对比、边界模糊的 3D 医学场景里效果明显下降。论文想解决的不是再训练一个更大的专用模型,而是如何让现有 foundation segmentation 模型真正适配 3D 医学图像。

方法上,作者没有直接微调整个 foundation model,而是采用组合式框架:用轻量 3D U-Net 产生粗定位,再把 foundation model 输出作为额外输入通道,与 MRI 一起进行分割,并探索了基于 DINO attention 的 prompt-free 变体。关键思想是把 foundation model 作为组合模块,而不是端到端重训。

这篇适合放在医学影像 / foundation model 适配主线。它的价值是把“大模型如何进入 3D 医学影像”这件事做得更务实,说明在强领域偏移场景下,组合式适配可能比直接微调基础模型更有效。

它没有升到更高一级,因为外溢主要集中在 3D 医学分割这一子方向,更多是强工程和强适配思路,而不是改变更广泛视觉基础模型路线的论文。

链接