带有记忆的量子过程强化学习
在强化学习中,智能体通过与环境进行序贯交互来最大化奖励,仅能获取部分概率性反馈。这产生了探索与利用的根本性权衡:智能体必须在学习隐藏动态特性的同时,利用已有知识最大化目标收益。虽然该框架在经典场景中已被广泛研究,但将其应用于量子系统时,需要处理通过未知动态演化的隐藏量子态。该研究团队通过建立环境维护隐藏量子记忆(通过未知量子通道演化)、智能体使用量子仪器序贯干预的框架,将这一问题形式化。针对此设定,研究人员采用了一种基于乐观最大似然估计的改进算法。该工作将分析扩展至连续动作空间,从而能够对一般正算子值测度(POVM)进行建模。通过控制量子通道和仪器中估计误差的传播,该团队证明所提策略的累积遗憾度按𝒪̃(√K)随K次实验次数的变化规律增长。进一步地,通过将其约化为多臂量子老虎机问题,研究人员建立了信息论下界,表明这种亚线性增长特性在忽略多对数因子情况下严格最优。作为物理应用案例,该工作研究了状态无关的自由能提取问题。当从由隐藏记忆关联的非独立同分布量子态序列中提取自由能时,对信源认知的任何缺失都会导致热力学耗散。在此设定下,数学层面的遗憾度精确量化了这种累积耗散。通过自适应算法,智能体能够利用历史能量输出来动态优化提取方案,实现亚线性累积耗散,从而获得渐近趋零的耗散率。
量科快讯
27 分钟前
41 分钟前
【澳大利亚国立大学科学家在原子中实现了量子纠缠的首次观测】澳大利亚国立大学(ANU)的量子物理学家首次在运动状态下观测到原子纠缠。据研究人员称,他们的实验使用氦原子,相比以往使用光子进行的类似实验取…
1 天前
【比利时与波兰研究人员开发出可以验证任何量子态的通用方案】比利时布鲁塞尔自由大学、波兰格但斯克大学和波兰科学院的研究人员近期提出一种新的通用方案,可用于自我检测任意量子态或量子测量。据研究人员介绍,…
1 天前
【研究人员开发的新协议可用于在大规模量子实验中重建量子态】法国格勒诺布尔阿尔卑斯大学、德国慕尼黑工业大学、德国马克斯·普朗克量子光学研究所、奥地利因斯布鲁克大学和意大利博洛尼亚大学的研究人员近期开发…
1 天前
【超导量子计算机企业IQM获贝莱德集团5000万欧元投资】全栈超导量子计算机企业IQM昨日宣布,它已获得由BlackRock(贝莱德集团)管理的基金及账户提供的5000万欧元(约4亿元人民币)融资。…
2 天前
2 天前

