量子组合推理在大语言模型中的应用

该团队设计并实现了一种用于大语言模型的量子组合推理框架(QCR-LLM),在混合工作流程中集成了真实的量子计算机。QCR-LLM将推理聚合重新表述为一个高阶无约束二进制优化(HUBO)问题。在这种方法中,推理片段被表示为二进制变量,它们的交互编码了统计相关性、逻辑一致性和语义冗余性。研究人员通过经典方法(模拟退火)和量子方法(在IBM超导数字量子处理器上执行的偏置场数字化反绝热量子优化器BF-DCQO)来解决这一高阶优化问题。 在BIG-Bench Extra Hard(BBEH)基准测试上的实验表明,该研究团队的QCR-LLM持续提高了多个LLM主干的推理准确性,超越o3-high和DeepSeek R1等原生推理系统达+9个百分点。尽管每个查询需要多个推理样本,但由于其GPT-4o主干低每标记能量消耗,该团队的QCR-LLM仍比o3-high能效高出约五倍。这些结果构成了量子辅助推理的首个实验证据,表明混合量子-经典优化能够有效提升大规模语言模型的推理一致性、可解释性和可持续性。该工作开启了量子智能涌现的大门——其中更困难的提示需要达到量子优势水平的量子优化器。
作者所在地: VIP可见
作者单位: VIP可见
提交arXiv: 2025-10-28 15:20

量科快讯