公共卫生与医疗运营
突破级
暂无讲解视频
收录解读
这篇 Nature 论文把 medical VLM 从 2D 图像和短报告推进到 3D abdominal CT 的 foundation model 工作流。
Merlin 使用 multistage pretraining,从 15,331 个 CT scans、超过 600 万图像、180 万诊断代码和 600 万 report tokens 学习,不依赖额外人工标注。
评估覆盖 6 类任务和 752 个具体任务,包括 zero-shot findings、phenotype classification、cross-modal retrieval、5-year chronic disease prediction、report generation 和 3D semantic segmentation,并在 44,098 个外部 CT scans 上验证。
它值得正式收录,因为它不是单一医学预测器,而是可复用的 3D medical VLM/dataset/system pattern,对医学影像 foundation model、跨模态检索、报告生成和临床工作流自动化都有长期参考价值。