VERITAS: Verifiable Epistemic Reasoning for Image-Derived Hypothesis Testing via Agentic Systems

科学发现旗舰工作突破级暂无讲解视频

收录解读

VERITAS 面向医学影像和临床多模态数据里的假设检验瓶颈：一个自然语言科研假设通常需要临床、影像、编程、统计多个角色协作，流程碎片化且难以审计。论文把这个流程显式拆成多智能体协作的可执行科学工作流。

系统从自然语言假设出发，生成分析计划、影像分割、统计代码和最终结论，并用 epistemic evidence label 把结果机械归类为 Supported、Refuted、Underpowered 或 Invalid。关键不是只输出答案，而是保留从假设到代码、mask 和统计结论的证据链。

它值得收录，是因为它把 agentic scientific discovery 里的“自动研究”落到一个可审计、可执行、可反驳的临床数据假设测试接口上。这个设计对 AI for science、医学研究 workflow、agent 可验证执行都有复用价值。

局限在于目前仍是特定临床多模态任务上的系统验证，泛化到更开放的实验设计和真实临床研究治理还需要更多证据。