光学计算的高效训练
衍射光学信息处理器在实现高速、并行且节能的机器学习推理任务方面展现出显著潜力。然而,受限于大规模数据集和先进分类模型所需的多次模拟计算,训练过程仍存在巨大计算瓶颈。此类系统的基础线性变换本质上受限于循环矩阵与对角矩阵的复合运算,分别对应光的自由空间传播及相位/振幅调制。虽然理论上证明任意线性变换均可通过此类矩阵因子实现,但现有研究仅提出理论上的因子数量上限,实际实验难以达成。此外,层间距离、层数、纯相位调制等物理参数进一步缩小了解决方案的可行空间。由于缺乏可解析的矩阵分解方法,先前研究多采用受限的最小化优化技术。由于可训练参数仅占整体变换的微小部分,现有技术会产生不必要的计算开销,制约了系统扩展性。本研究通过利用衍射系统在训练与推理中固有的结构化稀疏特性,实现了训练时间的显著缩减。该团队提出了一种融合傅里叶变换平面波分解的新型反向传播算法,仅需基变换和逐元素乘法运算,即可同步计算单层所有可训练参数的梯度。鉴于可实现光学架构尚缺闭式数学分解方案,该方法不仅对机器学习任务具有重要价值,还可广泛应用于任意线性变换生成、波前整形及其他信号处理任务。
