基于学习的量子LDPC码列表序贯置信传播译码
量子低密度奇偶校验(QLDPC)码是容错量子计算的有力候选方案,但由于短环、简并性以及标准置信传播(BP)译码器收敛性差等问题,高效译码仍是一项重大挑战。该研究通过将基于强化学习的序贯变量节点调度(RL-S)框架与列表搜索相结合,提出了一种基于强化学习的列表序贯(RL-LS)BP译码器,用于QLDPC码。在每一步中,学习到的策略选择下一个要更新的变量节点;随后,译码器保留常规的RL-S轨迹,同时探索一个竞争分支,该分支通过将更新后的LLR对向第二最可能的泡利符号进行软偏置、重新计算关联的局部BP消息,并将已访问的变量节点设置为该第二优符号来获得。候选轨迹使用该研究提出的累积路径度量进行排序和剪枝。由此得到的译码器通过将学习到的序贯调度改进的收敛性与列表探索相结合,扩展了学习到的译码器。在去极化信道下对代表性QLDPC基准码进行的数值结果表明,该研究提出的方法提升了底层译码器的译码性能,并且与现有的基于BP的译码方法相比具有优势。

