科学发现旗舰工作
突破级
暂无讲解视频
收录解读
VERITAS 面向医学影像和临床多模态数据里的假设检验瓶颈:一个自然语言科研假设通常需要临床、影像、编程、统计多个角色协作,流程碎片化且难以审计。论文把这个流程显式拆成多智能体协作的可执行科学工作流。
系统从自然语言假设出发,生成分析计划、影像分割、统计代码和最终结论,并用 epistemic evidence label 把结果机械归类为 Supported、Refuted、Underpowered 或 Invalid。关键不是只输出答案,而是保留从假设到代码、mask 和统计结论的证据链。
它值得收录,是因为它把 agentic scientific discovery 里的“自动研究”落到一个可审计、可执行、可反驳的临床数据假设测试接口上。这个设计对 AI for science、医学研究 workflow、agent 可验证执行都有复用价值。
局限在于目前仍是特定临床多模态任务上的系统验证,泛化到更开放的实验设计和真实临床研究治理还需要更多证据。