ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence

科学发现旗舰工作突破级暂无讲解视频

发表时间: 2026-05-25
arXiv: 2605.26340

核心要点

问题/背景: 这篇论文抓住 autonomous research agents 的核心短板：自动生成论文表面完整，但引用、分数、代码实现和方法描述可能不可验证。
方法/机制: Chain-of-Evidence 要求每个 claim 绑定证据来源，ScientistOne 在文献综述、方案发现和写作过程中持续维护证据链。
结果/证据: CoE Audit 把 score verification、specification violation、reference verification 和 method-code alignment 统一成后验审计接口，用来比较不同自动科研系统的完整性失败。
收录价值: 收录价值在于它把 AI Scientist 类系统的评估从论文外观推进到 evidence-grounded research integrity，是科研 agent 的关键安全/可靠性边界。

完整收录解读

这篇论文抓住 autonomous research agents 的核心短板：自动生成论文表面完整，但引用、分数、代码实现和方法描述可能不可验证。

Chain-of-Evidence 要求每个 claim 绑定证据来源，ScientistOne 在文献综述、方案发现和写作过程中持续维护证据链。

CoE Audit 把 score verification、specification violation、reference verification 和 method-code alignment 统一成后验审计接口，用来比较不同自动科研系统的完整性失败。

收录价值在于它把 AI Scientist 类系统的评估从论文外观推进到 evidence-grounded research integrity，是科研 agent 的关键安全/可靠性边界。

论文摘要

ScientistOne 引入了 Chain-of-Evidence，要求每个自主研究声明都可追溯到证据来源。它在文献综述、解决方案发现和论文写作过程中构建证据链，并提出 CoE Audit 用于评分验证、规范违规、引用验证和方法-代码对齐。

英文原文

ScientistOne introduces Chain-of-Evidence, requiring every autonomous research claim to be traceable to an evidence source. It builds evidence chains throughout literature review, solution discovery, and paper writing, and proposes CoE Audit for score verification, specification violations, reference verification, and method-code alignment.

链接

论文链接论文链接代码

核心要点

论文摘要

相关论文

链接