AutoHarness: improving LLM agents by automatically synthesizing a code harness

智能体与自主科学突破级有讲解视频

发表时间: 2026-03-04
arXiv: 2603.03329

收录解读

这篇论文解决的是 LLM agent 在交互环境中经常出现的非法动作、格式错误和环境约束违反问题。很多 agent 不是不会推理，而是输出无法被环境执行，导致整轮任务失败。作者把问题聚焦在一个很工程化但又普遍存在的瓶颈：如何在不人工手写环境约束规则的前提下，让模型自动获得可靠的动作执行边界。

论文提出 AutoHarness，让模型自动合成一个 code harness，把环境规则、动作格式和运行时检查写成可执行代码，再让 agent 在这个约束层内行动。它不是简单加 prompt 规则，而是把约束显式编译成程序接口。摘要给出的结果表明，在 145 个 TextArena 游戏中，AutoHarness 能显著减少非法动作，并让较小模型通过 harness 超过更大但无 harness 的模型。

这篇工作的价值在于把 agent safety 和 agent reliability 里的一个常见问题，转化成代码合成与执行约束问题来处理。它适合放在仓库的 agent systems / tool use 主线，代表一种比单纯 prompt engineering 更稳的 agent 外部脚手架思路。对交互式代理、游戏环境代理、工具使用代理都有现实参考价值。

它还不到更高一级，因为证据主要集中在 TextArena 一类交互游戏环境，尚未证明在更开放的现实工具链、企业工作流或科学实验系统中同样稳定有效。它是强的 agent engineering 论文，但还不是重定义整条 agent 路线的范式级工作。

解读视频

B 站 YouTube

链接

论文链接