收录解读
这篇论文把 autonomous research 从一串局部尝试改造成可累积的 hypothesis-tree process。
核心结构是 long-lived coordinator、short-lived executors 和持久化 HTR 树,把假设、证据、产物和经验跨时间保存。
它值得收录,因为它提供了面向自动科研/自动优化的可复用认知与执行架构。
局限在于当前证据主要来自预印本实验与作者自建评测,后续需要独立复现和更大范围部署验证。
原始摘要与中文对照
中文对照翻译
本文介绍了Arbor,一个基于假设树细化(HTR)的自主研究框架。一个长寿命的协调器管理着一棵连接假设、产物、证据和提炼出的见解的持久树,而短寿命的执行器在独立的“工作树”中测试假设。在自主优化设置下,Arbor通过迭代实验改进研究产物,并报告了在六项任务上的最佳保留结果以及强大的MLE-Bench Lite性能。
原始摘要
The paper introduces Arbor, a framework for autonomous research based on Hypothesis Tree Refinement (HTR). A long-lived coordinator manages a persistent tree linking hypotheses, artifacts, evidence, and distilled insights, while short-lived executors test hypotheses in isolated worktrees. Under an Autonomous Optimization setting, Arbor improves research artifacts through iterative experimentation and reports best held-out results across six tasks and strong MLE-Bench Lite performance.