智能体与自主科学
突破级
有讲解视频
收录解读
EngiAI 把 LLM agents 放进真实工程设计流程,而不是只做文本问答:任务覆盖拓扑优化、参数检索、HPC 作业编排和 3D 打印控制。
论文同时给出 benchmark suite 和 LangGraph 多 agent 参考实现,评估 direct tool use、语义消歧、条件分支、工作记忆、RAG gate 和 SLURM 集群端到端编排。
它值得正式收录,因为它为 engineering-design agents 提供了可复用评测接口和系统原型,正好对应 CAD/工程设计 workflow 的新增收录方向。
它没有更高,是因为当前只有两个 EngiBench 问题和有限模型后端,真实工程约束、制造误差和安全责任链还需扩展。