AI 硬件与加速器
突破级
暂无讲解视频
收录解读
这篇 PNAS 论文处理 AI 训练硬件的根问题:现代深度学习训练几乎完全依赖电子加速器和 backpropagation,能耗与规模扩展压力越来越大。
作者在 hybrid electronic-photonic platform 上实验实现 direct feedback alignment,用 optical processing unit 执行该算法核心的大规模随机矩阵乘法。
论文报告在语言、视觉和 diffusion-based generative tasks 上训练现代架构,包括超过 1B 参数的 Transformers,并分析 ultra-deep / wide networks 下的训练时间 scaling。
它值得正式收录,因为它不是普通光计算器件展示,而是把可训练算法、光电矩阵运算和现代 Transformer/扩散架构连接起来,提供 AI 训练硬件路线的可复用证据。