推理、记忆与推理时控制 突破级 暂无讲解视频
发表时间
2026-05-20
arXiv
2605.21488

收录解读

Equilibrium Reasoners 提出一种不同于 CoT 采样和 verifier reranking 的 reasoning scaling 思路:把推理看成向 latent attractor 收敛。

模型学习可迭代更新的吸引子动力学,在测试时通过更多迭代接近稳定解,而不必依赖外部 verifier 或大量候选答案投票。

这种机制与 attractor networks、隐空间搜索和 test-time compute 有直接联系,为 reasoning model 提供了新的控制接口。

它值得正式收录,因为它为可扩展推理提供了结构性替代方案,可能影响长程推理、数学任务和 agent planning。

链接