智能体与自主科学
突破级
暂无讲解视频
收录解读
这篇论文把 test-time scaling 和 multi-agent orchestration 连接起来。它不是简单多采样,而是通过多个专门 agent 的协同来扩大推理时计算。
TMAS 的价值在于把测试时计算预算组织成 agent collaboration problem,包括分工、记忆共享和探索/利用平衡。这比单模型 self-consistency 更接近复杂任务执行系统。
它值得正式收录,因为 inference-time scaling 正在成为大模型能力提升的核心路线,而 multi-agent synergy 提供了一个可复用系统模式。
它没有更高,是因为多 agent 系统容易增加成本和不稳定性,仍需更多真实任务、延迟约束和失败分析。