科学发现旗舰工作 突破级 有讲解视频
发表时间
2026-05-19
arXiv
2605.20025

收录解读

AutoResearchClaw 针对自动科研系统的线性管线缺陷:失败后停止、缺少跨轮经验、缺少多视角质询和结果可验证性。

系统包含多 agent debate、Pivot/Refine 自修复执行器、可验证结果报告、人机协作的七种介入模式,以及把历史错误转化为未来 safeguards 的 cross-run evolution。

它值得正式收录,因为它把 autonomous research 从一次性论文生成扩展到带失败利用、人类高杠杆介入和经验积累的循环系统。

它没有更高,是因为 ARC-Bench 仍偏实验阶段基准,真实跨学科实验室长期使用还需要证据。

解读视频

链接