量子增强型神经上下文赌博算法
随机情境赌博机是序列决策制定的基础,但其对现有基于神经网络的算法提出了重大挑战——尤其在扩展到量子神经网络(QNN)时,会面临严重过参数化、计算不稳定性和贫瘠高原现象等问题。该研究团队提出量子神经正切核-置信上界(QNTK-UCB)算法,通过利用量子神经正切核(QNTK)应对这些局限。该算法将QNN冻结在随机初始化状态,并以其静态QNTK作为核函数进行岭回归,从而规避了显式参数化量子电路训练中固有的不稳定动态,同时充分挖掘了量子特有的归纳偏差。理论分析表明,对于时间范围T和K个动作,QNTK-UCB实现了Ω((TK)^3)的显著参数缩放改进,较经典NeuralUCB算法实现相似后悔保证所需的Ω((TK)^8)大幅降低。在非线性合成基准测试和量子原生变分量子本征求解任务上的实证评估显示,QNTK-UCB在低数据区域具有卓越的样本效率。该工作揭示了QNTK固有特性如何提供隐式正则化和更锐利的谱衰减,为在线学习中实现“量子优势”开辟了新路径。
量科快讯
1 小时前
2 小时前
1 天前
1 天前
2 天前

