QuantumQA：通过物理一致性数据集与验证感知强化学习提升科学推理能力 | 量子科技中心_量科网

QuantumQA：通过物理一致性数据集与验证感知强化学习提升科学推理能力

ArXiv预印本仅供参考 2026-04-22 11:03

参考来源 ➔ 下载PDF ➔

大语言模型（LLMs）在通用推理方面展现出强大能力，但在量子力学等科学领域通常缺乏可靠性——这些领域要求严格遵守物理约束。这种局限性源于可验证训练资源的稀缺性，以及标准对齐范式中粗粒度反馈信号的不足。为解决数据挑战，该团队推出了QuantumQA数据集，该大规模数据集通过任务自适应策略和混合验证协议构建。该协议结合确定性求解器与语义审核，确保科学严谨性。在此基础上，该团队提出专用于“可验证奖励强化学习（RLVR）”的验证感知奖励模型（VRM），采用自适应奖励融合（ARF）机制，动态整合来自科学执行套件（SES）的确定性信号与多维语义评估，实现精确监督。实验结果表明，该方法持续超越基线模型和通用偏好模型。值得注意的是，经过优化的80亿参数模型取得了与专有模型相媲美的性能，验证了将可验证的、基于规则的反馈纳入强化学习循环，能够为纯粹参数扩展提供一种高效替代方案。

作者单位： VIP可见

页数/图表： 登录可见

提交arXiv： 2026-04-20 12:33

量科快讯

【罗马尼亚克将建设一座80兆瓦的量子人工智能数据中心，总投资10亿美元】美国科技公司DriverAI LLC近日宣布，将在罗马尼亚克卢日县的卢纳建设一座80兆瓦的量子人工智能数据中心，这将是罗马尼亚首个集成量子A…

1 小时前

【首届金砖国家量子技术论坛于日前在莫斯科召开，俄白两国将深化量子技术领域的合作】首届金砖国家量子技术论坛近日在莫斯科举行，来自科学界、产业界和政府部门的专家齐聚一堂，共同探讨量子技术领域的合作前景。该论坛指出，量子技术是…

1 小时前

【日本与德国团队合作开发出在金刚石中精准埋入生长NV色心的新工艺】日本金泽大学与德国金刚石与碳应用公司合作，开发出一种利用微波等离子体化学气相沉积（MPCVD）技术在金刚石中埋入生长氮-空位（NV）色心的新…

1 小时前

【ThinkQuantum牵头启动光子集成量子密码系统项目，获意政府430万欧元资助】意大利量子通信技术解决方案开发商ThinkQuantum公司近日宣布牵头启动一个名为光子集成量子密码系统（PIQCS）的项目。这个为期五年的…

3 小时前

【我国科研人员开发出一种基于超导量子比特的高精度量子传感方法】北京量子信息科学研究院联合电子科技大学、中国科学院物理研究所等机构的研究人员，展示了一种基于超导量子比特的高精度量子传感方法。该方法将非平衡…

4 小时前

【东京大学新研究表明：量子存储器在检索未知信道方面要显著优于经典存储器】日本东京大学的一个研究团队近日在《物理评论快报》上发表一项成果，证明量子方法在存储和检索未知等距信道方面要显著优于经典方法。该团队评估了量子…

4 小时前

【ELECTRA AI将与Naoris合作开发后量子网络安全框架，守护电池智能系统安全】ELECTRA AI与Naoris Quantum Protocol近日宣布达成一项合作，将共同开发面向人工智能驱动的电池智能系统中的后量子…

4 小时前

【科学家开发出量子神经网络训练框架，并在离子阱系统上验证了临床数据表现】一组国际研究团队开发出一种量子神经网络训练框架，能够在量子硬件上直接进行基于梯度的优化，且在临床数据集上的表现与强经典补值方法相当。该框架结…

5 小时前

【Multiverse Computing在大规模量子多体模拟领域取得重大突破】Multiverse Computing的科学家近日在大规模量子多体模拟领域取得重大突破，证明了先进的张量网络方法能够触及此前被认为超出经典…

5 小时前

【密歇根大学科学家在一个桌面实验中巧妙融合了广义相对论与量子力学】美国密歇根大学的一个研究团队展示了一项将广义相对论与量子力学两大基础物理理论相结合的桌面实验，为探索二者在微观与宏观尺度下的交汇点提供了新路…

6 小时前

【瑞典团队成功在动态可重构电信网络中部署远距离量子密钥分发链路】由瑞典林雪平大学、瑞典皇家理工学院、斯德哥尔摩大学和查尔姆斯理工大学组成的研究团队，近日在arXiv上发布了一项预印本研究，报告了将远距离可…

6 小时前

【悉尼大学科学家首次对真实分子的化学动力学进行了量子模拟】悉尼大学的研究人员最近首次对真实分子的化学动力学进行了量子模拟，相关成果已于日前发表在《美国化学会志》上。该研究通过模拟分子受光激发后的行为…

6 小时前

【印度理工学院曼迪分校宣布下学年将新增量子科学与工程等三大本科专业】印度理工学院曼迪分校（IIT Mandi）近日宣布，该校自下个学年起将新增三个本科专业：量子科学与工程、农业工程（数据分析方向）、化学工程（…

7 小时前

【印度科学研究所多管齐下，欲打造印度量子技术创新完整生态链】印度科学研究所（IISc）近日迎来一系列重要里程碑：Wadhwani-IISc创新中心揭牌，发布量子初创加速平台InQubate，以及202…

20 小时前

【欧洲量子计算新里程碑！第6台EuroHPC量子计算机在意大利正式启用】欧洲高性能计算联合体（EuroHPC JU）近日在意大利博洛尼亚正式启用第6台EuroHPC量子计算机“SOL”，以及莱昂纳多超级计算机的升…

21 小时前

【瑞典六所高校联合成立量子技术中心，将打造国家级研究枢纽】瑞典六所高校近日联合签署谅解备忘录，共同成立瑞典量子技术中心，以打造一个集研究、创新、教育与能力建设于一体的国家级量子技术枢纽。参与高校包括…

21 小时前

【意大利首台中性原子量子计算机SOL上线，基于Pasqal的Orion量子处理器】法国中性原子量子计算领军企业Pasqal近日宣布，在意大利博洛尼亚CINECA数据中心正式启用了意大利首台中性原子量子计算机。该系统被命名为…

21 小时前

【Alice & Bob发布氦量子系统，18个猫量子比特可编码一个逻辑量子比特】法国容错量子计算公司Alice & Bob近日推出了氦量子系统，标志着其从猫量子比特芯片设计正式迈入提供完整、可本地部署的量子计算系…

21 小时前

【IQM的Radiance 54量子计算机在CINECA启用，将与全球顶级超算之一集成】意大利高性能计算、大数据与量子计算研究中心（ICSC）近日在欧洲顶级超算中心之一CINECA正式启用了IQM的Radiance 54量子计算…

22 小时前

【JILA与因斯布鲁克科学家合作利用镱原子打造出多用途量子比特平台】JILA与奥地利因斯布鲁克大学的研究人员合作，近日在《自然·物理学》期刊上发表了一项研究，展示了镱原子作为量子比特的多功能性。该团队将中性镱…

22 小时前

【量子摩擦新发现：光照射会让碳纳米管运动变慢，速度随光强增加而减小】德国波鸿鲁尔大学的一个研究团队发现，光竟然能够减慢纳米材料的运动速度，这背后的机理源于一种此前知之甚少的“量子摩擦”现象。该团队使用荧光碳纳…

22 小时前

【Horizon Quantum第二台量子计算机落户都柏林，将采购IonQ 256量子比特离子阱系统】Horizon Quantum日前宣布，计划在爱尔兰都柏林部署其第二台量子计算机，采购的是IonQ第六代256量子比特离子阱系统。Horiz…

22 小时前

【英国量子风投机构Firgun首次押注澳大利亚，选中硅量子计算领军者SQC】伦敦量子风投机构Firgun Ventures近日宣布了其在澳大利亚的首笔投资，全球硅基量子计算领域的先驱企业Silicon Quantum…

23 小时前

【爱尔兰东南理工大学参与三大Rinn研究中心建设，涵盖量子技术等尖端方向】近日，爱尔兰东南理工大学（SETU）宣布将参与该国新设立的七个Rinn研究中心中的三个，这是爱尔兰一项4.6亿欧元国家研究投资的重要组成部分…

23 小时前

【澳大利亚投入500万澳元在悉尼大学启动量子计算未来领袖培训中心】澳大利亚研究理事会近日在悉尼大学启用了“量子计算未来领袖培训中心（FLiQC）”，旨在为澳大利亚培养一支面向未来的强大量子专业人才队伍。澳大…

23 小时前

【欧洲量子学院下设六个区域学院，ICFO将领衔西南区域量子学院建设】最近推出的欧洲量子学院（EQA）旨在通过构建覆盖全欧洲的教育与人才发展体系，巩固欧洲在量子技术领域的自主能力。作为该学院的合作伙伴，ICFO…

1 天前

【牛津物理学家的创新方法能将杂质自旋做为量子自旋液体的“见证者”】牛津大学的物理学家提出一种探寻量子自旋液体的新方法。该研究团队以矿石Herbertsmithite为研究对象，首次将杂质自旋重新概念化为量子…

3 天前

【跨大西洋新纪录！Colt与Ciena完成最快800GbE量子安全数据传输试验】Colt Technology Services近日与Ciena合作完成了一次跨大西洋量子安全数据传输的里程碑式试验，这也是跨大西洋线路上迄…

3 天前

【JIJ联合ORCA等发布白皮书：混合量子-经典优化在能源行业正迈向商业应用】日本JIJ公司与英国ORCA Computing公司近日联合英国石油公司bp及英国国家量子计算中心（NQCC）发布一份白皮书，证明混合量子-…

3 天前

【新综述揭示光子空间纠缠有望成为量子技术的关键资源】德国达姆施塔特工业大学的一个研究团队近日在《激光与光子学评论》期刊上发表了一篇关于“位置-动量纠缠”的综述论文，系统总结了该领域的研究现状并…

3 天前