利用部分信息通过主动反馈学习稳定物质非平衡相

该研究团队通过强化学习探索了信息在量子多体系统主动反馈控制中的作用。主动反馈打破了细致平衡条件,使得工程化制备平衡态下无法实现的物质稳态和动力学相成为可能。研究人员利用部分态信息训练强化学习智能体,在包含128个量子比特的(1+1)维稳定器电路中成功抑制了纠缠态扩散。研究发现,当信息量超过临界阈值时,所习得的近最优策略具有非贪婪、随机性特征,能将体积律纠缠的稳态转变为面积律标度。智能体通过构建一系列瓶颈结构,在长时间空间纠缠分布中诱导出金字塔构型,有效分割系统并降低最大可达纠缠度。值得注意的是,这些学习策略本质上是非平衡态过程,必须依赖实时主动反馈——研究证实无法用简单的人为设计控制规则替代。该工作为经典计算机实现多自由度量子系统的信息驱动个体控制奠定基础,展现出强化学习在稳定多体非平衡稳态及发现新临界特性方面的强大能力。

量科快讯