QuantumBench: 量子问题求解基准测试 | 量智信息中心_量科网

QuantumBench: 量子问题求解基准测试

ArXiv预印本仅供参考 2025-11-05 00:22

参考来源 ➔ 下载PDF ➔

目前，大型语言模型已融入众多科研工作流程，显著提升了数据分析、假说生成与设计空间探索的效率。随着应用的扩展，研究人员亟需严谨评估这些模型是否准确掌握专业领域的知识与符号体系，因为通用评估基准往往无法满足这类需求。这一短板在量子科学领域尤为突出——该学科既包含反直觉现象，又依赖高阶数学工具。本研究推出首个量子领域专用评估基准QuantumBench，系统考察大模型对这一反直觉学科的理解与应用能力。借助公开资料，该团队编制了约800道涵盖量子科学九大分支的题目及参考答案，并将其组织为八选项多选题数据集。基于此基准，研究人员对现有多个大模型进行评测，分析其在量子领域的表现（包括对题型变化的敏感性）。作为量子学科首个大模型评估数据集，QuantumBench旨在为量子研究中大模型的有效运用提供指引。

作者所在地： VIP可见

作者单位： VIP可见

页数/图表： 登录可见

提交arXiv： 2025-10-30 06:44

量科快讯

【Anthropic安全模型发现PQC算法缺陷，后量子签名方案HAWK退出NIST候选评审】近日，有研究人员利用人工智能公司Anthropic的安全分析模型Mythos发现了后量子密码算法HAWK中一个可能导致方案失效的安全缺陷。H…

4 小时前

【新加坡金管局成立专项工作组加速金融行业向量子安全迁移】新加坡金融管理局（MAS）近日宣布，与新加坡银行公会（ABS）联合成立工作组，以应对人工智能和量子计算给金融机构带来的网络安全与诈骗风险。该…

4 小时前

【NVision量子增强MRI平台进军韩国延世大学将部署其POLARIS系统】德国NVision Quantum日前宣布，其与韩国延世大学、德国乌尔姆大学及荷兰Tesla Dynamic Coils共同获得欧盟“地平线…

4 小时前

【IBM与Qedma通过可信量子计算模拟了超越经典能力的量子动力学现象】量子误差缓解软件公司Qedma与IBM昨日联合公布一项突破性研究成果，证明可信的、经误差缓解的量子计算能够用于探索材料物理，并展示了一个面向…

5 小时前

【韩国研究团队开发出集成了不可区分量子光源的混合量子网络架构】韩国釜山国立大学的一个研究团队开发出一种结合了不同量子光源的混合量子网络架构，实现了不可区分的光子的生成。该团队通过优化量子光源之间的匹配技…

5 小时前

【DigiCert发布第二版《后量子密码学入门指南》，助力企业推进向后量子密码迁移】数字证书和网络信任服务提供商DigiCert昨日宣布发布第二版《后量子密码学入门指南》，旨在帮助企业了解量子计算对现有密码体系带来的潜在影响…

6 小时前

【IBM与多家合作机构的研究人员通过可信量子计算成功展示量子优势】昨日，芝加哥大学、Qedma、Algorithmiq的研究人员与IBM合作发表的三篇论文展示了量子优势的实证研究，并报告了一种构建量子计算信…

6 小时前

【IBM与Algorithmiq展示量子优势，提出超越经典验证的可信量子计算框架】IBM与Algorithmiq昨日联合宣布在量子计算领域取得重要里程碑：通过开发一种异质量子物质模型，在IBM Heron量子处理器上执行材…

6 小时前

【后量子安全公司pQCee完成390万美元种子轮融资，将加速全球市场扩张】新加坡量子安全技术公司pQCee最近宣布完成最新一轮390万美元种子轮融资。本轮融资由SGInnovate和Lotus Singapore…

7 小时前

【韩国量子计算企业Norma推出MCP服务，探索AI智能体驱动量子计算工作流】韩国量子计算企业Norma近日宣布正式推出“Q Platform MCP”服务，将量子计算能力接入基于大语言模型的AI智能体生态，使用户能够…

1 天前

【Infleqtion任命量子计算系统高级副总裁，将领导Sqale中性原子量子计算机研发】Infleqtion近日宣布任命Joseph Buck博士为量子计算系统高级副总裁，他将领导公司可扩展中性原子量子计算机Sqale的研发。I…

1 天前

【Freedom Factory推出抗量子硬件钱包，应对量子计算对加密资产的潜在威胁】Freedom Factory近日发布面向数字资产安全的抗量子硬件钱包PQ1，这是一款专为抵御量子计算攻击而设计的后量子硬件钱包，旨在为所有…

1 天前

【量子安全技术公司EigenQ宣布两项重要管理层人事任命】量子技术公司EigenQ近日宣布，任命量子安全领域权威专家Mark Pecen为董事会副主席，同时将密码学副总裁Alexander Trus…

1 天前

【NordForsk启动G7-北欧量子技术联合计划，将资助12个量子研究合作项目】NordForsk发起了一项G7-北欧量子技术研究联合资助计划，将为最多12个国际协作项目提供资金支持，覆盖量子计算、量子通信、量子传感、量…

1 天前

【IonQ获最终批准收购SkyWater，加速量子芯片制造能力布局】量子平台公司IonQ日前已获得美国监管部门最终批准，完成对美国最大的纯本土半导体代工厂SkyWater Technology的收购。收购完成…

1 天前

【Cloudflare新动作：两项产品已支持后量子身份认证ML-DSA算法】Cloudflare昨日宣布，其Authenticated Origin Pulls和Custom Origin Trust Store两款…

1 天前

【面向物理AI时代，SEALSQ加速推进量子安全的硬件信任根】SEALSQ昨日宣布更新其最初于2026年3月公布的抗量子硬件认证路线图。该公司表示，随着人工智能向自主物理AI系统演进，从机器人、车辆到边…

1 天前

【安永加拿大主导在本地部署一台量子计算机，加速企业量子应用探索】安永（EY）宣布扩展其全球量子计算能力，EY加拿大公司主导部署了一台本地安装的量子计算机，这是EY在人工智能及其他前沿技术领域超过30亿美元…

1 天前

【Horizon Quantum与QM联手为Ember-1超导量子系统量身打造嵌入式校准框架】Horizon Quantum昨日宣布与Quantum Machines（QM）达成战略合作，共同开发嵌入式校准技术，以提升量子系统的效率，…

1 天前

【美国量子经济发展联盟发布新版《量子网络应用路线图》】美国量子经济发展联盟（QED-C）发布了新版《量子网络应用路线图》，确定了在安全通信、网络计算和分布式传感等领域实现具有商业价值的量子网络应…

1 天前

【Riverlane与Unitary基金会设立DeltaKit社区基金，支持量子纠错开源生态建设】英国量子纠错公司Riverlane昨日宣布与Unitary Foundation联合推出DeltaKit Community Fund社区基…

2 天前

【四家量子技术企业签约加入美国首个开放接入的纠缠量子网络ABQ-Net】四家领先量子技术企业Infleqtion、Bandelier、Tensora与Aliro昨日签约加入美国首个开放接入、基于纠缠的量子网络AB…

2 天前

【Bloq Quantum与QClairvoyance达成合作，共推量子教育与劳动力培训】量子软件基础设施提供商Bloq Quantum与量子技术研究与教育机构QClairvoyance近日宣布建立战略合作伙伴关系，双方将共同推动…

2 天前

【香港金管局发布《香港银行业量子准备度白皮书》，并公布量子准备度指数】香港金管局昨日发布《香港银行业量子准备度白皮书》，并首次公布量子准备度指数，评分仅为2.3分（满分10分），显示银行业在量子技术部署上仍处于…

2 天前

【Multiverse Computing获5.7亿美元C轮融资，估值较B轮涨5倍达17亿美元】Multiverse Computing日前宣布完成5.7亿美元（约5亿欧元）C轮融资，投前估值达17亿美元（约15亿欧元），较其B轮估值增…

2 天前

【PQSecure与QuickLogic成功将双方的后量子密码和eFPGA硬IP相集成】PQSecure Technologies与QuickLogic近日成功演示了将PQSecure-Agility后量子密码IP与后者的eFP…

2 天前

【英国NCSC与沃达丰联合发布后量子密码迁移建议，敦促组织提前应对量子威胁】英国国家网络安全中心（NCSC）与沃达丰（Vodafone）近日分享了双方联合主办的英国首次政府与行业后量子密码（PQC）迁移专题研讨会形成…

2 天前

【量子技术公司Qubitrium宣布参与北约双重用途量子技术暑期培训计划】量子技术公司Qubitrium昨日宣布，将作为共同组织者和学术联合主任参与北约科技组织（NATO STO）2026年暑期培训计划“双重用途量…

2 天前

【瑞士量子计算公司ZuriQ完成2550万美元种子轮融资，Quantonation领投】从苏黎世联邦理工学院拆分的瑞士量子计算公司ZuriQ昨日宣布完成2550万美元种子轮融资，由Quantonation领投，此轮融资是其在20…

2 天前

【Quside推出quside-curand库，以将量子熵接入英伟达CUDA工作流】Quside近日宣布推出C++/CUDA库quside-curand，可通过类似cuRAND的主机生成器接口，将该公司的Garnet Plu…

3 天前