通过二进制优化的泛基因组引导序列组装

在高度重复区域进行从头基因组组装具有挑战性;然而基于参考基因组的组装工具往往存在偏好性偏差。该研究团队提出了一种泛基因组指导的序列组装框架,能在不偏向单一参考基因组的情况下解析复杂区域的短读长数据。该工作将组装问题建模为图遍历优化问题,该算法可在量子计算机上实现。该流程首先用估计的节点拷贝数注释泛基因组图,然后寻找最优解释这些拷贝数的图路径。在模拟数据上,与从头组装工具相比,该方法显著减少了重叠群数量。尽管会略微增加错误连接等不准确性,但该团队基于优化的方法在当前穷举搜索技术中具有竞争力。这些方法还设计了更高效的可扩展性,能随着问题规模扩大保持性能,并将在未来量子计算机上高效运行。

量科快讯