AI 硬件与加速器 突破级 暂无讲解视频
发表时间
2026-04-16
arXiv
2604.14709

收录解读

问题与背景:硬件设计 LLM 评测多停留在孤立 HDL 生成,缺少 repo-scale bug repair 和真实 regression flow。

方法与新意:HWE-Bench 从六个开源硬件项目的真实 bug-fix PR 构造 417 个任务,覆盖 RISC-V cores、SoCs 和 roots-of-trust,并在容器化环境中用项目原生仿真/回归验证正确性。

收录意义:这篇对 AI hardware/design agents 价值很高,因为它把 SWE-bench 式评测迁移到硬件 bug repair,并保留真实仓库、真实工具链和真实回归约束。

局限:benchmark 仍集中在开源项目,商业硬件流程、私有 IP、复杂 EDA 许可和长周期验证尚未覆盖。

链接