Streamlined optical training of large-scale modern deep learning architectures with direct feedback alignment

AI 硬件与加速器突破级暂无讲解视频

收录解读

这篇 PNAS 论文处理 AI 训练硬件的根问题：现代深度学习训练几乎完全依赖电子加速器和 backpropagation，能耗与规模扩展压力越来越大。

作者在 hybrid electronic-photonic platform 上实验实现 direct feedback alignment，用 optical processing unit 执行该算法核心的大规模随机矩阵乘法。

论文报告在语言、视觉和 diffusion-based generative tasks 上训练现代架构，包括超过 1B 参数的 Transformers，并分析 ultra-deep / wide networks 下的训练时间 scaling。

它值得正式收录，因为它不是普通光计算器件展示，而是把可训练算法、光电矩阵运算和现代 Transformer/扩散架构连接起来，提供 AI 训练硬件路线的可复用证据。