科学发现旗舰工作
突破级
有讲解视频
收录解读
AutoResearchClaw 针对自动科研系统的线性管线缺陷:失败后停止、缺少跨轮经验、缺少多视角质询和结果可验证性。
系统包含多 agent debate、Pivot/Refine 自修复执行器、可验证结果报告、人机协作的七种介入模式,以及把历史错误转化为未来 safeguards 的 cross-run evolution。
它值得正式收录,因为它把 autonomous research 从一次性论文生成扩展到带失败利用、人类高杠杆介入和经验积累的循环系统。
它没有更高,是因为 ARC-Bench 仍偏实验阶段基准,真实跨学科实验室长期使用还需要证据。