泛基因组引导序列组装中的非变分量子优化方法

从短读长测序数据中组装基因组在重复区域仍然具有挑战性,参考序列偏差和组合复杂性限制了现有方法的表现。泛基因组引导序列组装(PGSA)通过将个体基因组重建为遍历群体级别图谱的路径,有效减轻了参考偏差。这一关联问题——即确定节点访问路径与读长衍生拷贝数相匹配——属于NP难问题,即使中等规模数据集也已使传统求解器面临挑战。该研究团队针对这一计算瓶颈开发了近期量子优化解决方案。研究人员比较了两种问题编码方式:既有的二次无约束二进制优化(QUBO)和新型高阶二进制优化(HUBO)模型。后者将变量数量从O(N²)降至O(NlogN),使中等规模实例适配当前量子设备的量子比特预算。团队采用迭代量子近似优化算法(Iterative-QAOA)框架进行求解,该框架结合固定线性斜坡QAOA调度与迭代热启动偏置更新,避免了全变分参数优化的计算开销。相比标准工具,定制化电路编译策略将硬件门开销降低达67%。在QUBO问题的无噪声模拟中,Iterative-QAOA仅需评估10-17%的候选解即可可靠识别最优组装方案,IBM量子硬件通过条件风险价值(CVaR)式后选择充分采样后能准确复现关键结果。对于HUBO模型,变量减少的代价是更深层编译电路和更高噪声敏感性——这符合量子比特与电路深度的预期权衡。该工作确立了泛基因组组装作为量子优化可能率先实现实用价值的、具有明确生物学意义的典型问题类别。
作者单位: VIP可见
提交arXiv: 2026-04-07 17:17

量科快讯