智能体与自主科学 突破级 暂无讲解视频
发表时间
2026-04-15
arXiv
2604.12126

收录解读

这篇论文面向大工具空间里的长程计划执行,指出当前 tool agents 缺少 plan-level 评估,也缺少在巨大 API 决策空间中高效搜索的机制。

它提出 SLATE 作为大规模上下文感知 API benchmark,并提出 Entropy-Guided Branching,在预测熵高的位置动态展开分支,平衡探索和计算成本。

按本库标准,它值得收录,因为它同时提供 benchmark 和执行算法,直接服务 tool orchestration、large tool library 和 long-horizon agent planning。

局限是 SLATE 是 synthetic e-commerce toolkit,真实企业工具空间中的权限、状态副作用和错误恢复会更复杂。

链接