智能体与自主科学 突破级 暂无讲解视频
发表时间
2025-04-10
arXiv
2504.08066

收录解读

这篇工作真正重要的地方,不是单纯证明 LLM 能写论文,而是把 scientific workflow 的核心环节串成了一个可运行的端到端系统:提出假设、设计实验、写代码、运行实验、分析结果、作图和撰写论文都放进同一条 agentic loop。与早期依赖手工模板的系统相比,v2 的关键提升是 progressive agentic tree search 和专门的 experiment manager。

它之所以值得正式收录,是因为它把‘AI scientist’从概念演示推进到了可核验的 peer-review experiment。按 Sakana 的实验协议,3 篇完全 AI 生成稿件中有 1 篇拿到了高于 workshop 平均接收阈值的评分,虽然按预设伦理协议在最终发表前撤回,但这已经足够说明系统开始进入真实科研制度的外圈。

它对本库的意义不只是自动写作,而是 agent-driven scientific workflow 的系统边界:什么程度的自主实验、审稿反馈循环、图表 refinement 和 manager-agent orchestration 才能让一个研究代理跨过最初的可用门槛。后续无论药物发现、材料设计还是算法自动发现,都可以把它当作一个上位参考。

它没有更高,是因为当前证明点仍停留在 workshop 级别、少量样本、且需要实验性合作协议;同时作者自己也明确承认距离主会/顶刊标准仍有差距。

链接