EngiAI: A Multi-Agent Framework and Benchmark Suite for LLM-Driven Engineering Design

智能体与自主科学突破级有讲解视频

收录解读

EngiAI 把 LLM agents 放进真实工程设计流程，而不是只做文本问答：任务覆盖拓扑优化、参数检索、HPC 作业编排和 3D 打印控制。

论文同时给出 benchmark suite 和 LangGraph 多 agent 参考实现，评估 direct tool use、语义消歧、条件分支、工作记忆、RAG gate 和 SLURM 集群端到端编排。

它值得正式收录，因为它为 engineering-design agents 提供了可复用评测接口和系统原型，正好对应 CAD/工程设计 workflow 的新增收录方向。

它没有更高，是因为当前只有两个 EngiBench 问题和有限模型后端，真实工程约束、制造误差和安全责任链还需扩展。