科学发现旗舰工作 颠覆级 暂无讲解视频
发表时间
2025-06-17

收录解读

- 分级:`颠覆性` - 正式标题:`AlphaEvolve: A coding agent for scientific and algorithmic discovery` - 原文:`2025-06-17-S1_AlphaEvolve-AlphaEvolve_A_coding_agent_for_scientific_and_algorithmic_discovery.pdf` - 抽取:`extracted.md`

## 重写摘要

AlphaEvolve 的关键突破,不是“让 LLM 写代码”,而是让 LLM 在可执行、可评测的进化闭环里持续改进算法。系统把候选程序交给评估器打分,再用进化式搜索不断保留高分变体,从而把语言模型的创造性和程序执行的确定性绑定在一起。结果是它不只会提出想法,而是能在反馈回路里发现更优算法。

这篇白皮书最重要的证据来自两类场景。第一类是科学与数学:AlphaEvolve 找到了两个 4×4 复矩阵只用 48 次标量乘法的程序,并在高维组合与几何构造问题上刷新记录。第二类是现实基础设施:它为 Google 数据中心调度发现了更优启发式,为 FlashAttention 相关内核和 TPU 电路设计给出可落地优化,并报告 Borg 调度长期回收约 0.7% 的全局算力资源。

## 为什么重要

它把“可验证输出”变成智能复利的核心。只要程序可以被执行和打分,模型就不再只是一次性生成器,而能成为持续发现算法和优化基础设施的搜索系统。这对自动科学发现、算法设计和 AI 自我改进都很关键。

## 局限

当前公开载体是 DeepMind 白皮书,发布时间为 `2025-06-17`,不在你最初的三个月窗口内。它的很多结果依赖专有评估环境和 Google 内部基础设施,外部复现门槛仍然很高。

链接