Meta-Harness: End-to-End Optimization of Model Harnesses

Yoonho Lee; Roshen Nair; Qizheng Zhang; Kangwook Lee; Omar Khattab; Chelsea Finn

智能体与自主科学颠覆级有讲解视频

发表时间: 2026-03-30
arXiv: 2603.28052

收录解读

大语言模型系统的表现不仅由模型权重决定，也深受 harness 影响，也就是决定哪些信息被存储、检索和呈现给模型的那层代码逻辑。现实里这部分仍主要靠人工设计，而现有文本优化器又往往把反馈压缩得过度，难以真正搜索代码级 harness 设计空间。

Meta-Harness 的核心贡献是把 harness optimization 做成 outer-loop code search。系统中的 proposer agent 能读取源代码、历史候选的分数以及执行轨迹，并在文件系统层面访问完整经验，而不是只拿到高度压缩的文本反馈。它因此能对上下文管理、检索逻辑和呈现策略进行端到端搜索，并在在线分类、检索增强数学推理和 agentic coding 三类设置中稳定优于手工或既有 context-management baseline。

它值得正式收录，因为这篇工作推进的不只是 prompt 优化，而是把 harness 本身提升成可自动设计的第一类对象。仓库里已经有 AutoHarness 和 Natural-Language Agent Harnesses，这篇则更进一步，把 harness engineering 从单条技巧推进到可搜索的 outer-loop workflow，对 agent system design 和 model orchestration 都有明显耐久外溢。

它目前定为 disruptive 而不是更高一级，因为证据仍主要来自 arXiv 阶段和有限任务组合，离成为广泛默认的 harness engineering 范式还有距离；同时其搜索成本、跨应用泛化和工程落地复杂度仍需要更多后续验证。

解读视频

视频观看页 B 站 YouTube

链接

论文链接

收录解读

解读视频

相关论文

链接