一种用于直接量子退火组合优化的无惩罚流水线方法
直接量子退火投资组合优化通常被表述为带有惩罚项的 QUBO 问题,并提交至 D-Wave 硬件上求解。研究表明,这种标准公式在当前设备上失效,并识别出其结构原因:基数惩罚项贡献了一个与全1矩阵成比例的稠密秩一项,使得无论协方差结构如何,逻辑交互图都变为完全图。在 Pegasus 和 Zephyr 拓扑上,当 N=24 时链断裂比例达到 83%,N=49 时达到 92%,导致无法产生可行样本。试图通过拓扑感知稀疏化来解决这一问题时,又暴露出第二个问题:任何移除非对角项的稀疏化方法都会同时削弱基数约束,因此即使链不再断裂,原始样本仍然不可行。消融实验表明,对于结构有利的情形(如基于结算图先验的投注问题),经典可行性投影器本身就能解释结果,而非量子处理单元 (QPU) 的作用。该研究提出完全放弃惩罚项:仅从期望收益和风险缩放协方差构建目标函数 QUBO,在硬件上采样,并在后处理步骤中经典地强制执行基数约束。在 D-Wave Advantage 和 Advantage2 上,对于 N≤49 的股票问题和 N≤48 的投注问题,每次读取的样本平均链断裂比例从 71%–92% 的范围降至最高 0.04%。在 N=39 和 N=48 的投注问题上,QPU 返回的可行投资组合能量低于贪心启发式算法(此为能量比较,非最优性证明),且在所有测试规模下,股票问题的后处理遗憾值最高仅为 0.03%。这些结果证明,在当前可及的规模下,惩罚编码(而非稀疏硬件拓扑)才是直接 QPU 投资组合优化的根本约束。

