可扩展的量子神经网络片上训练及其在临床数据填补中的应用
训练量子神经网络(QNN)当前在量子硬件上的瓶颈在于梯度估计的成本:标准的参数平移方法所需的电路评估次数与可训练参数数量呈二次方增长,这使得基于硬件的优化在系统规模较小时便难以实现。该工作引入了一种训练框架,将这一成本降低至与量子比特数成对数关系,从而使得基于梯度的QNN优化在近期硬件上随着规模扩大变得可行。该框架结合了三个协同设计的要素:(i) 一种结构化、子空间保持的蝶形电路架构,具有 \(O(n \log n)\) 个参数和对数深度;(ii) 一种逐层训练策略,将硬件上的优化限制在每次处理一个较小且结构良好的层;(iii) 一种并行化参数平移规则,利用每个蝶形层内的对易结构,在常数次电路执行中提取所有梯度。这些方法共同将每个优化步骤所需的独立电路评估次数从 \(O(n^2)\) 减少到 \(O(\log n)\)。研究团队使用MIMIC-III电子健康记录数据集在临床数据填补任务上验证了该框架,这是一个对优化不稳定性和模型方差有较高要求的基准测试。混合经典-量子模型直接在IonQ Forte Enterprise离子阱硬件上以16量子比特进行训练,性能相比理想或噪声仿真未出现下降,并通过张量网络仿真在32量子比特上训练,同时在硬件上执行32量子比特推理。所得模型在下游患者生存预测中达到或超越了强经典神经网络基线,同时展现出更低的运行间方差,表明该框架能够在现实硬件约束下实现实用且可扩展的QNN训练。

