AI 硬件与加速器 突破级 有讲解视频
发表时间
2026-03-25
arXiv
2603.24517

收录解读

现有 evolutionary search 即使接入 LLM,也往往只是把模型当候选生成器,真正的 mutation、crossover 和局部修补逻辑仍然由人手工定义。AVO 的切入点更深:不是让 agent 在既定搜索框架里吐候选,而是让 agent 直接充当 variation operator,自主读取 lineage、知识库和执行反馈,决定如何改写候选实现。

论文提出 Agentic Variation Operators,把 propose、repair、critique、verify 统一进一个自驱动 agent loop。作者用它搜索 Blackwell B200 上的 multi-head attention kernel,连续七天自动演化后,得到的 kernel 在多种配置上超过 cuDNN 和 FlashAttention-4,而且还可以快速迁移到 grouped-query attention。这里真正有新意的是“agent 作为 variation operator”这个抽象,而不只是某个 kernel 的最终性能数字。

它值得正式收录,因为它把自动搜索从 candidate generation 推进到了更通用的 agentic search primitive,对 AI 系统优化、kernel search、自动化硬件/软件协同设计都有明确外溢。尤其在 attention kernel 这种已经被高度人工优化的目标上还能持续超越现有实现,说明这条路线不只是概念包装。

它目前仍是 breakthrough,而不是更高一级,因为公开验证还集中在 attention kernel 这一类目标和 Blackwell 这一代硬件上。是否能成为跨系统、跨算法、跨硬件的默认 agentic optimization interface,还需要更广泛的任务族验证。

解读视频

链接