Toward Autonomous Long-Horizon Engineering for ML Research

智能体与自主科学突破级暂无讲解视频

发表时间: 2026-04-14
arXiv: 2604.13018

收录解读

这篇论文聚焦自主 AI 研究中最难落地的一段：长时程 ML research engineering。相比一次性代码生成，真实研究工程需要理解任务、配置环境、实现、实验、debug，并在数小时到数天内保持状态连续。

AiScientist 使用层级 orchestration 和 File-as-Bus 工作区，把计划、代码、实验结果、错误分析等 durable artifacts 当作跨 agent 共享状态。顶层 orchestrator 维护阶段控制，专门 agent 反复重新 ground 到文件证据，而不是依赖脆弱聊天上下文。

它值得收录，是因为它提供了 agent-driven research workflow 的系统模式：薄控制层、文件状态总线、分阶段证据驱动执行。这个模式与仓库当前关注的 agent memory、capability extension、科学工作流高度一致。

局限在于论文仍需证明在更多真实研究任务和更长周期中的鲁棒性；File-as-Bus 是实用强模式，但并不自动解决研究目标选择和实验可靠性。

链接

论文链接