智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-04-14
arXiv
2604.13018

收录解读

这篇论文聚焦自主 AI 研究中最难落地的一段:长时程 ML research engineering。相比一次性代码生成,真实研究工程需要理解任务、配置环境、实现、实验、debug,并在数小时到数天内保持状态连续。

AiScientist 使用层级 orchestration 和 File-as-Bus 工作区,把计划、代码、实验结果、错误分析等 durable artifacts 当作跨 agent 共享状态。顶层 orchestrator 维护阶段控制,专门 agent 反复重新 ground 到文件证据,而不是依赖脆弱聊天上下文。

它值得收录,是因为它提供了 agent-driven research workflow 的系统模式:薄控制层、文件状态总线、分阶段证据驱动执行。这个模式与仓库当前关注的 agent memory、capability extension、科学工作流高度一致。

局限在于论文仍需证明在更多真实研究任务和更长周期中的鲁棒性;File-as-Bus 是实用强模式,但并不自动解决研究目标选择和实验可靠性。

链接