科学发现旗舰工作
突破级
有讲解视频
收录解读
问题与背景:高性能并行文件系统调优长期依赖专家经验,参数空间复杂、人工成本高,对大多数科研用户不友好。把 LLM 直接用于系统调优,是 agentic AI 进入 HPC 基础设施的一条实用路线。
方法/新意:STELLAR 构建了一个自治调优器,用 LLM 推理系统状态、选择参数配置,并在少数尝试内逼近近最优配置。其重点不只是让模型给建议,而是让模型进入真实并行存储系统的闭环决策。
意义/放在仓库中的位置:这是 agentic systems / AI for infrastructure 的代表作,和 FlashAttention、AlphaEvolve 的系统侧价值形成互补。它说明 LLM agent 不只面向知识工作,也可以进入 HPC 基础设施调优。
局限/为何不再升一级:影响面目前主要在并行文件系统与系统调优,虽然实用性强,但学术外溢性不如更通用的 agentic science 或 model architecture 论文。