带有记忆的量子过程强化学习 | 量智信息中心_量科网

带有记忆的量子过程强化学习

ArXiv预印本仅供参考 2026-03-28 11:27

参考来源 ➔ 下载PDF ➔

在强化学习中，智能体通过与环境进行序贯交互来最大化奖励，仅能获取部分概率性反馈。这产生了探索与利用的根本性权衡：智能体必须在学习隐藏动态特性的同时，利用已有知识最大化目标收益。虽然该框架在经典场景中已被广泛研究，但将其应用于量子系统时，需要处理通过未知动态演化的隐藏量子态。该研究团队通过建立环境维护隐藏量子记忆（通过未知量子通道演化）、智能体使用量子仪器序贯干预的框架，将这一问题形式化。针对此设定，研究人员采用了一种基于乐观最大似然估计的改进算法。该工作将分析扩展至连续动作空间，从而能够对一般正算子值测度（POVM）进行建模。通过控制量子通道和仪器中估计误差的传播，该团队证明所提策略的累积遗憾度按𝒪̃(√K)随K次实验次数的变化规律增长。进一步地，通过将其约化为多臂量子老虎机问题，研究人员建立了信息论下界，表明这种亚线性增长特性在忽略多对数因子情况下严格最优。作为物理应用案例，该工作研究了状态无关的自由能提取问题。当从由隐藏记忆关联的非独立同分布量子态序列中提取自由能时，对信源认知的任何缺失都会导致热力学耗散。在此设定下，数学层面的遗憾度精确量化了这种累积耗散。通过自适应算法，智能体能够利用历史能量输出来动态优化提取方案，实现亚线性累积耗散，从而获得渐近趋零的耗散率。

作者单位： VIP可见

页数/图表： 登录可见

提交arXiv： 2026-03-26 07:58

量科快讯

【Anthropic安全模型发现PQC算法缺陷，后量子签名方案HAWK退出NIST候选评审】近日，有研究人员利用人工智能公司Anthropic的安全分析模型Mythos发现了后量子密码算法HAWK中一个可能导致方案失效的安全缺陷。H…

5 小时前

【新加坡金管局成立专项工作组加速金融行业向量子安全迁移】新加坡金融管理局（MAS）近日宣布，与新加坡银行公会（ABS）联合成立工作组，以应对人工智能和量子计算给金融机构带来的网络安全与诈骗风险。该…

5 小时前

【NVision量子增强MRI平台进军韩国延世大学将部署其POLARIS系统】德国NVision Quantum日前宣布，其与韩国延世大学、德国乌尔姆大学及荷兰Tesla Dynamic Coils共同获得欧盟“地平线…

6 小时前

【IBM与Qedma通过可信量子计算模拟了超越经典能力的量子动力学现象】量子误差缓解软件公司Qedma与IBM昨日联合公布一项突破性研究成果，证明可信的、经误差缓解的量子计算能够用于探索材料物理，并展示了一个面向…

6 小时前

【韩国研究团队开发出集成了不可区分量子光源的混合量子网络架构】韩国釜山国立大学的一个研究团队开发出一种结合了不同量子光源的混合量子网络架构，实现了不可区分的光子的生成。该团队通过优化量子光源之间的匹配技…

7 小时前

【DigiCert发布第二版《后量子密码学入门指南》，助力企业推进向后量子密码迁移】数字证书和网络信任服务提供商DigiCert昨日宣布发布第二版《后量子密码学入门指南》，旨在帮助企业了解量子计算对现有密码体系带来的潜在影响…

7 小时前

【IBM与多家合作机构的研究人员通过可信量子计算成功展示量子优势】昨日，芝加哥大学、Qedma、Algorithmiq的研究人员与IBM合作发表的三篇论文展示了量子优势的实证研究，并报告了一种构建量子计算信…

7 小时前

【IBM与Algorithmiq展示量子优势，提出超越经典验证的可信量子计算框架】IBM与Algorithmiq昨日联合宣布在量子计算领域取得重要里程碑：通过开发一种异质量子物质模型，在IBM Heron量子处理器上执行材…

8 小时前

【后量子安全公司pQCee完成390万美元种子轮融资，将加速全球市场扩张】新加坡量子安全技术公司pQCee最近宣布完成最新一轮390万美元种子轮融资。本轮融资由SGInnovate和Lotus Singapore…

8 小时前

【韩国量子计算企业Norma推出MCP服务，探索AI智能体驱动量子计算工作流】韩国量子计算企业Norma近日宣布正式推出“Q Platform MCP”服务，将量子计算能力接入基于大语言模型的AI智能体生态，使用户能够…

1 天前

【Infleqtion任命量子计算系统高级副总裁，将领导Sqale中性原子量子计算机研发】Infleqtion近日宣布任命Joseph Buck博士为量子计算系统高级副总裁，他将领导公司可扩展中性原子量子计算机Sqale的研发。I…

1 天前

【Freedom Factory推出抗量子硬件钱包，应对量子计算对加密资产的潜在威胁】Freedom Factory近日发布面向数字资产安全的抗量子硬件钱包PQ1，这是一款专为抵御量子计算攻击而设计的后量子硬件钱包，旨在为所有…

1 天前

【量子安全技术公司EigenQ宣布两项重要管理层人事任命】量子技术公司EigenQ近日宣布，任命量子安全领域权威专家Mark Pecen为董事会副主席，同时将密码学副总裁Alexander Trus…

1 天前

【NordForsk启动G7-北欧量子技术联合计划，将资助12个量子研究合作项目】NordForsk发起了一项G7-北欧量子技术研究联合资助计划，将为最多12个国际协作项目提供资金支持，覆盖量子计算、量子通信、量子传感、量…

1 天前

【IonQ获最终批准收购SkyWater，加速量子芯片制造能力布局】量子平台公司IonQ日前已获得美国监管部门最终批准，完成对美国最大的纯本土半导体代工厂SkyWater Technology的收购。收购完成…

1 天前

【Cloudflare新动作：两项产品已支持后量子身份认证ML-DSA算法】Cloudflare昨日宣布，其Authenticated Origin Pulls和Custom Origin Trust Store两款…

1 天前

【面向物理AI时代，SEALSQ加速推进量子安全的硬件信任根】SEALSQ昨日宣布更新其最初于2026年3月公布的抗量子硬件认证路线图。该公司表示，随着人工智能向自主物理AI系统演进，从机器人、车辆到边…

1 天前

【安永加拿大主导在本地部署一台量子计算机，加速企业量子应用探索】安永（EY）宣布扩展其全球量子计算能力，EY加拿大公司主导部署了一台本地安装的量子计算机，这是EY在人工智能及其他前沿技术领域超过30亿美元…

1 天前

【Horizon Quantum与QM联手为Ember-1超导量子系统量身打造嵌入式校准框架】Horizon Quantum昨日宣布与Quantum Machines（QM）达成战略合作，共同开发嵌入式校准技术，以提升量子系统的效率，…

1 天前

【美国量子经济发展联盟发布新版《量子网络应用路线图》】美国量子经济发展联盟（QED-C）发布了新版《量子网络应用路线图》，确定了在安全通信、网络计算和分布式传感等领域实现具有商业价值的量子网络应…

1 天前

【Riverlane与Unitary基金会设立DeltaKit社区基金，支持量子纠错开源生态建设】英国量子纠错公司Riverlane昨日宣布与Unitary Foundation联合推出DeltaKit Community Fund社区基…

2 天前

【四家量子技术企业签约加入美国首个开放接入的纠缠量子网络ABQ-Net】四家领先量子技术企业Infleqtion、Bandelier、Tensora与Aliro昨日签约加入美国首个开放接入、基于纠缠的量子网络AB…

2 天前

【Bloq Quantum与QClairvoyance达成合作，共推量子教育与劳动力培训】量子软件基础设施提供商Bloq Quantum与量子技术研究与教育机构QClairvoyance近日宣布建立战略合作伙伴关系，双方将共同推动…

2 天前

【香港金管局发布《香港银行业量子准备度白皮书》，并公布量子准备度指数】香港金管局昨日发布《香港银行业量子准备度白皮书》，并首次公布量子准备度指数，评分仅为2.3分（满分10分），显示银行业在量子技术部署上仍处于…

2 天前

【Multiverse Computing获5.7亿美元C轮融资，估值较B轮涨5倍达17亿美元】Multiverse Computing日前宣布完成5.7亿美元（约5亿欧元）C轮融资，投前估值达17亿美元（约15亿欧元），较其B轮估值增…

2 天前

【PQSecure与QuickLogic成功将双方的后量子密码和eFPGA硬IP相集成】PQSecure Technologies与QuickLogic近日成功演示了将PQSecure-Agility后量子密码IP与后者的eFP…

2 天前

【英国NCSC与沃达丰联合发布后量子密码迁移建议，敦促组织提前应对量子威胁】英国国家网络安全中心（NCSC）与沃达丰（Vodafone）近日分享了双方联合主办的英国首次政府与行业后量子密码（PQC）迁移专题研讨会形成…

2 天前

【量子技术公司Qubitrium宣布参与北约双重用途量子技术暑期培训计划】量子技术公司Qubitrium昨日宣布，将作为共同组织者和学术联合主任参与北约科技组织（NATO STO）2026年暑期培训计划“双重用途量…

2 天前

【瑞士量子计算公司ZuriQ完成2550万美元种子轮融资，Quantonation领投】从苏黎世联邦理工学院拆分的瑞士量子计算公司ZuriQ昨日宣布完成2550万美元种子轮融资，由Quantonation领投，此轮融资是其在20…

2 天前

【Quside推出quside-curand库，以将量子熵接入英伟达CUDA工作流】Quside近日宣布推出C++/CUDA库quside-curand，可通过类似cuRAND的主机生成器接口，将该公司的Garnet Plu…

3 天前