TMAS: Scaling Test-Time Compute via Multi-Agent Synergy

智能体与自主科学突破级暂无讲解视频

收录解读

这篇论文把 test-time scaling 和 multi-agent orchestration 连接起来。它不是简单多采样，而是通过多个专门 agent 的协同来扩大推理时计算。

TMAS 的价值在于把测试时计算预算组织成 agent collaboration problem，包括分工、记忆共享和探索/利用平衡。这比单模型 self-consistency 更接近复杂任务执行系统。

它值得正式收录，因为 inference-time scaling 正在成为大模型能力提升的核心路线，而 multi-agent synergy 提供了一个可复用系统模式。

它没有更高，是因为多 agent 系统容易增加成本和不稳定性，仍需更多真实任务、延迟约束和失败分析。