推理、记忆与推理时控制
突破级
暂无讲解视频
收录解读
Equilibrium Reasoners 提出一种不同于 CoT 采样和 verifier reranking 的 reasoning scaling 思路:把推理看成向 latent attractor 收敛。
模型学习可迭代更新的吸引子动力学,在测试时通过更多迭代接近稳定解,而不必依赖外部 verifier 或大量候选答案投票。
这种机制与 attractor networks、隐空间搜索和 test-time compute 有直接联系,为 reasoning model 提供了新的控制接口。
它值得正式收录,因为它为可扩展推理提供了结构性替代方案,可能影响长程推理、数学任务和 agent planning。