The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search

智能体与自主科学突破级暂无讲解视频

发表时间: 2025-04-10
arXiv: 2504.08066

收录解读

这篇工作真正重要的地方，不是单纯证明 LLM 能写论文，而是把 scientific workflow 的核心环节串成了一个可运行的端到端系统：提出假设、设计实验、写代码、运行实验、分析结果、作图和撰写论文都放进同一条 agentic loop。与早期依赖手工模板的系统相比，v2 的关键提升是 progressive agentic tree search 和专门的 experiment manager。

它之所以值得正式收录，是因为它把‘AI scientist’从概念演示推进到了可核验的 peer-review experiment。按 Sakana 的实验协议，3 篇完全 AI 生成稿件中有 1 篇拿到了高于 workshop 平均接收阈值的评分，虽然按预设伦理协议在最终发表前撤回，但这已经足够说明系统开始进入真实科研制度的外圈。

它对本库的意义不只是自动写作，而是 agent-driven scientific workflow 的系统边界：什么程度的自主实验、审稿反馈循环、图表 refinement 和 manager-agent orchestration 才能让一个研究代理跨过最初的可用门槛。后续无论药物发现、材料设计还是算法自动发现，都可以把它当作一个上位参考。

它没有更高，是因为当前证明点仍停留在 workshop 级别、少量样本、且需要实验性合作协议；同时作者自己也明确承认距离主会/顶刊标准仍有差距。

链接

论文链接项目