收录解读
医学影像里的 foundation model 真正难的地方,不是简单把图像模型搬到医疗数据上,而是如何利用临床场景中天然存在但噪声很高的弱监督信号,让模型学到跨疾病谱、跨任务可迁移的表示。心脏 MRI 尤其如此:它是时序影像、结构复杂、病种跨度大,而且临床价值高度依赖下游诊断和报告场景。
这篇工作提出的核心,是利用 routine clinical practice 中天然成对出现的 cardiac MRI 视频与对应文本报告,做 self-supervised / contrastive-style 预训练,构建面向心脏 MRI 的 domain foundation model。它不是围绕单一病种或单个 segmentation/classification 任务调模型,而是把临床生成的 scan-report pairing 当成可扩展监督接口,借此学习覆盖更完整心血管疾病谱的表征。
它值得正式收录,因为这条路线对 biomed foundation modeling 很有代表性:不是再做一个窄任务 predictor,而是把日常临床工作流本身转化成模型训练资源。对医学多模态基础模型、医疗报告配对学习、以及领域 foundation model 的构建方式都有直接外溢,也符合仓库对 AI x biomed 的高门槛要求。
它目前仍是 breakthrough,而不是更高一级,因为它的主要外溢仍然绑定在 cardiac MRI 这一高价值但明确收敛的模态与学科内。它展示了很强的 domain foundation-model 思路,但是否能进一步变成更一般的医学影像-文本建模范式,还需要跨模态、跨器官和跨机构的更广验证。