智能体与自主科学 颠覆级 有讲解视频
发表时间
2026-03-30
arXiv
2603.28052

收录解读

大语言模型系统的表现不仅由模型权重决定,也深受 harness 影响,也就是决定哪些信息被存储、检索和呈现给模型的那层代码逻辑。现实里这部分仍主要靠人工设计,而现有文本优化器又往往把反馈压缩得过度,难以真正搜索代码级 harness 设计空间。

Meta-Harness 的核心贡献是把 harness optimization 做成 outer-loop code search。系统中的 proposer agent 能读取源代码、历史候选的分数以及执行轨迹,并在文件系统层面访问完整经验,而不是只拿到高度压缩的文本反馈。它因此能对上下文管理、检索逻辑和呈现策略进行端到端搜索,并在在线分类、检索增强数学推理和 agentic coding 三类设置中稳定优于手工或既有 context-management baseline。

它值得正式收录,因为这篇工作推进的不只是 prompt 优化,而是把 harness 本身提升成可自动设计的第一类对象。仓库里已经有 AutoHarness 和 Natural-Language Agent Harnesses,这篇则更进一步,把 harness engineering 从单条技巧推进到可搜索的 outer-loop workflow,对 agent system design 和 model orchestration 都有明显耐久外溢。

它目前定为 disruptive 而不是更高一级,因为证据仍主要来自 arXiv 阶段和有限任务组合,离成为广泛默认的 harness engineering 范式还有距离;同时其搜索成本、跨应用泛化和工程落地复杂度仍需要更多后续验证。

解读视频

链接