通过现场可编程门阵列并行化降低张量网络算法的计算成本规模

从硬件角度提升量子多体计算效率仍是关键挑战。尽管现场可编程门阵列(FPGAs)近期已被用于改进蒙特卡洛等算法的计算复杂度,但其在张量网络算法中的应用仍处于早期阶段。该研究团队提出了一种基于FPGA的细粒度并行张量网络设计方案,显著提升了无限时间演化块 decimation(iTEBD)和高阶张量重整化群(HOTRG)两种代表性算法的计算效率。通过采用四元瓦片分割策略分解张量元并将其映射到硬件电路,该方案将算法计算复杂度转化为可扩展的硬件资源利用率,实现了FPGA上的极高并行度。与传统CPU实现相比,该方案在计算时间上展现出更优的可扩展性——将iTEBD的计算成本键维数复杂度从O(D_b^3)降至O(D_b),HOTRG的复杂度从O(D_b^6)降至O(D_b^2)。该工作为未来大规模张量网络计算的硬件实现奠定了理论基础。
作者所在地: VIP可见
作者单位: VIP可见
页数/图表: 登录可见
提交arXiv: 2026-02-05 17:16

量科快讯