公共卫生与医疗运营 突破级 暂无讲解视频
发表时间
2026-04-30
DOI
10.1038/s41586-026-10181-8

收录解读

这篇 Nature 论文把 medical VLM 从 2D 图像和短报告推进到 3D abdominal CT 的 foundation model 工作流。

Merlin 使用 multistage pretraining,从 15,331 个 CT scans、超过 600 万图像、180 万诊断代码和 600 万 report tokens 学习,不依赖额外人工标注。

评估覆盖 6 类任务和 752 个具体任务,包括 zero-shot findings、phenotype classification、cross-modal retrieval、5-year chronic disease prediction、report generation 和 3D semantic segmentation,并在 44,098 个外部 CT scans 上验证。

它值得正式收录,因为它不是单一医学预测器,而是可复用的 3D medical VLM/dataset/system pattern,对医学影像 foundation model、跨模态检索、报告生成和临床工作流自动化都有长期参考价值。

链接