智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-03-30
arXiv
2603.28986

收录解读

当前 autonomous scientific research 系统虽然越来越多,但大多仍依赖固定的 agent workflow 和预设工具栈,导致一旦任务结构变化或环境变复杂,系统很难自适应调整。Mimosa 瞄准的不是单一任务性能,而是‘科研 agent workflow 能否像程序一样被自动合成、执行、评估并持续进化’这个更上层问题。

论文提出 Mimosa,一个可进化的 multi-agent scientific workflow 框架。它通过 meta-orchestrator 自动生成任务特定的 agent 拓扑,用 MCP 做动态工具发现,再由 code-generating agents 调用科学软件与工具执行子任务;执行结果交给 LLM judge 评分,反馈再反向驱动 workflow refinement。也就是说,它把 multi-agent decomposition、tool discovery、execution trace 和 evolutionary refinement 接成了闭环。

这篇工作值得收录,因为它不是再做一个固定 agent,而是在 agent-driven science 方向给出了一种更 durable 的系统模式:任务来了先合成 workflow,再根据实验反馈迭代演化。这个结构对科学自动化、复杂分析流水线和自改进 agent 系统都有明显外溢价值,也和仓库近期补收的 self-evolving / workflow optimization 主线形成了很好衔接。

它没有升到更高一级,是因为当前主要验证还集中在 ScienceAgentBench 和作者给出的开源平台叙事上。虽然模式很对,且比普通 static multi-agent paper 更进一步,但离真正成为跨科学领域默认路线,还需要更多独立团队复现和更广场景 adoption。

链接