Long-Horizon Plan Execution in Large Tool Spaces through Entropy-Guided Branching

智能体与自主科学突破级暂无讲解视频

收录解读

这篇论文面向大工具空间里的长程计划执行，指出当前 tool agents 缺少 plan-level 评估，也缺少在巨大 API 决策空间中高效搜索的机制。

它提出 SLATE 作为大规模上下文感知 API benchmark，并提出 Entropy-Guided Branching，在预测熵高的位置动态展开分支，平衡探索和计算成本。

按本库标准，它值得收录，因为它同时提供 benchmark 和执行算法，直接服务 tool orchestration、large tool library 和 long-horizon agent planning。

局限是 SLATE 是 synthetic e-commerce toolkit，真实企业工具空间中的权限、状态副作用和错误恢复会更复杂。