收录解读
LLM-guided algorithm discovery 现在越来越多,但很多系统只优化代码产物和最终分数,弱化了理论结构、正确性约束和原创性判断,导致搜索过程更像 benchmark hacking,而不是科学意义上的算法发现。CliffSearch 试图把这一点纠正回来。
论文提出一个 agentic evolutionary framework,把每个搜索节点都表示为 structured scientific artifact,可以是 theory+code,也可以是 code_only;pair selection、crossover、mutation、review 等演化算子都由 LLM agents 执行,但 reviewer 对 correctness 与 originality 的判断被提升为第一类 selection gate,而不只是附带说明。作者还把 mutation 分成 exploration 与 correction 两条路径,分别处理新颖性引入和证据驱动修复。
这篇工作值得收录,因为它把 agentic scientific discovery 从代码搜索推进到‘理论与代码共演化’。这对 optimizer discovery、algorithm search、scientific coding agents 和更广的 AI for science workflow 都有很强的方法外溢,也和 AlphaEvolve 之后大家真正关心的‘如何把 discovery process 结构化’直接相关。
它没有升到更高一级,是因为当前主要还是在若干 benchmark-grounded case study 上展示统一框架,尚未证明这套 reviewer-gated theory+code co-evolution 会成为主流 scientific discovery agent 的默认蓝图。它非常值得收,但还不到更高层级。