智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-04-14
arXiv
2604.13018

收录解读

这篇论文关注 AI research agent 的关键瓶颈:长程 ML 工程不是一次回答,而是要跨任务理解、环境配置、实现、实验、调试和证据归档持续推进。

AiScientist 的核心是 hierarchical orchestration 加 File-as-Bus:控制层保持薄摘要和阶段管理,厚状态则沉淀在文件工作区、代码、实验记录和分析文档中,减少纯对话 handoff 的上下文丢失。

按本库标准,它是 agentic ML research workflow 的正式收录项,因为它提出了长程研究工程的状态连续性模式,并在 PaperBench/MLE-Bench Lite 上做了系统验证。

局限是名称容易与既有 AI Scientist 系列混淆,且结果仍依赖具体 benchmark 与 frontier model stack;真实科研自主性还需更严验证。

链接