无损模式扇入解决高效光子卷积运算

技术研究武汉光电国家研究中心 2025-08-18 08:05

近日，华中科技大学张新亮、董建绩教授团队成功开发了一种高效光子卷积器，该技术通过模式复用扇入解决了片上光信号合并时的损耗问题。相关研究成果发表在《Nature Communications》上，题目为 Highly Efficient Photonic Convolver via Lossless Mode-Division Fan-In 。

扇入问题：从“单道合流”到“立体通行”

在光子集成芯片中，扇入（Fan-in）是指将多路计算结果汇聚相加，是光学计算中常见操作之一。传统的单模扇入（single-mode fan-in，SFI）可类比为把多条车道强行并入一条单车道：所有通路的光信号必须挤进单模波导，光学互易机制导致模式不匹配与耦合损耗，造成显著信号衰减，从而限制系统级联规模（图1a）。

为解决这一问题，华中科技大学研究团队提出了一种无损的多模模式扇入（Multi-mode fan-in，MFI）解决方案，其核心思想是在同一波导内利用若干相互正交的空间模式，为每一路输入分配“专属车道”，即不同的正交模式，从而实现无损合并。形象地说，这相当于在微尺度上修建了一座“光子立交桥”：不同信号在各自模式通道中并行传输，避免了传统单模合并时的能量衰减。实验结果显示：传统单模扇入损耗约为3.53 dB，而多模扇入在三模式情况下的平均损耗均低于 0.4 dB，接近无损合并水平。

无损模式扇入解决高效光子卷积运算 — 图1. 基于无损模式扇入的光子卷积加速器原理。a) 单模扇入（SFI）与多模扇入（MFI）的原理及其散射矩阵；b) 光子卷积加速器整体设计，MKM代表多模核调制器，MWR代表多模波导路由。

将概念变为器件：米粒大小的光子卷积加速器

在解决模式扇入损耗问题后，研究团队进一步实现了一颗高度集成的光子卷积加速器芯片，完成了从物理概念到功能器件的验证。不同于传统依赖时间–波长交织（Xingyuan Yu, et al., Nature 589, 44-51, 2021）或波长–空间交织（Shiji Zhang, et al., Nanophotonics 13, 19-28, 2024）方案，该工作首次提出并实现了模式–空间交织的卷积架构，将空间模式作为独立计算维度，实现了可兼容并行波长维度的卷积操作。首先，输入向量并行加载到 M = 3 个正交空间模式，经多模 3-dB 耦合器分路后，信号扇出为4路，进入 N = 4 个多模核调制器（multimode kernel modulator, MKM）进行权重加载，即卷积核加载；随后通过多模波导路由（multimode waveguide routing, MWR）完成卷积滑窗操作，同一波导不同模式的求和由多模光电探测端口完成（即多模扇入），避免了单模耦合损耗。

该结构可并行处理 K个波长，单周期完成 K×M×N 次乘加（MAC）运算；滑窗操作通过光路自然传播实现，几乎不消耗额外功率。通过逆向设计，所有功能集成于面积仅约 0.42 mm²（不足米粒大小）的芯片上，计算精度约 6–7位。在 MNIST 手写数字识别任务中，该器件光域准确率达 95.2%，仅比电域低0.6%，理论计算密度可达 125.14 TOPS/mm²（每秒万亿次操作/平方毫米）。相比传统方案，该模式–空间卷积显著提升了吞吐率和能效，为片上大规模光子卷积及高密度光子互连提供了可扩展路径。

意义与展望

该研究提出的无损多模扇入方案，突破了片上光计算的信号合并损耗瓶颈，使卷积等核心算子在模式维度实现了高效、近乎无损的累加。结合模式–空间卷积架构，系统在同一芯片内完成空间滑窗，且兼容波分复用并行运算，显著提升了计算密度和能效比，为下一代低功耗、高吞吐率的人工智能（AI）硬件开辟了全新路径。

该项工作得到国家自然科学基金项目资助；博士研究生孙尚森与张世纪为论文共同第一作者，华中科技大学董建绩教授为通讯作者。