智能体与自主科学
突破级
暂无讲解视频
收录解读
现实 agent 工具调用并不是同步、单任务、即时返回;API 延迟、多任务并发和等待期间的调度会显著影响效率。
AsyncTool 把 delayed tool feedback 和多异构任务并发放入同一交互环境,评估 agent 是否能在等待工具返回时切换任务、维护依赖、追踪状态并提升总完成效率。
论文提出 step、sub-task 和 task 层级指标,以及效率导向指标,暴露当前模型在异步工具调用中的状态维护和调度失败。
它值得收录,因为 asynchronous tool use 是真实 agent runtime 的关键能力;AsyncTool 提供了可复用评测接口,补上了同步函数调用 benchmark 的盲区。