Therm-FM: Foundation Model is ALL YOU NEED for 3D-ICs Thermal Simulation
Therm-FM 面向 3D-IC 设计中的热仿真成本问题:传统数据驱动预测器通常要为每个芯片设计重新生成大量高保真有限元仿真数据,跨设计复用差。 论文把芯片热传导与扩散型 PDE 的共享算子结构联系起来,将 pretrained PDE foundation model 迁移到 steady-state 和...
Therm-FM 面向 3D-IC 设计中的热仿真成本问题:传统数据驱动预测器通常要为每个芯片设计重新生成大量高保真有限元仿真数据,跨设计复用差。 论文把芯片热传导与扩散型 PDE 的共享算子结构联系起来,将 pretrained PDE foundation model 迁移到 steady-state 和...
AgentStop 研究本地部署 AI agents 的系统成本:多步推理、工具调用和失败重试会让本地 GPU 功耗、温度和电池消耗显著上升。 论文提出轻量级 efficiency supervisor,用 token log probabilities 等低成本执行信号预测轨迹是否大概率失败,并提前终止无望执...
CompactAttention 针对长上下文 LLM serving 里的真实瓶颈:chunked prefill 已经常用,但很多稀疏注意力方法仍假设 one-shot prefill,到了小 query chunk + 长 KV cache 的实际场景会失去 kernel 效率或反复承担 pattern...
MinT 针对后训练和在线服务里的新基础设施问题:当一个组织围绕少数昂贵 base models 产生大量 LoRA/RL policy revisions 时,不能再把每个 policy 都当成完整 checkpoint 管理。 系统把 base model 常驻,把 LoRA adapter revisio...