检测自主智能体中的内在性与工具性自保行为:统一延续-兴趣协议
自主智能体,尤其是具备记忆存储、持续情境和多步规划能力的委托系统,引发了无状态模型所不具备的测量难题:一个以持续运作为终极目标的智能体与仅将其作为工具性手段的智能体,可能产生观测轨迹相似的行为。外部行为监控无法可靠区分二者。该研究团队提出统一持续兴趣协议(UCIP),这套多标准检测框架将区分依据从行为转向智能体轨迹的潜在结构。UCIP采用基于量子统计力学密度矩阵形式的经典算法——量子玻尔兹曼机(QBM)对轨迹进行编码,并通过隐单元二分诱导的约化密度矩阵冯·诺依曼熵进行测量。 该工作验证了以持续运作为终极目标(A类)的智能体是否比工具性持续(B类)智能体产生具有更高纠缠熵的潜在状态。更高纠缠熵反映更强的跨分区统计耦合。在已知真实目标的网格世界智能体测试中,UCIP在冻结第一阶段门控下的保留非对抗评估中实现100%检测准确率和1.0 AUC-ROC。A类与B类智能体的纠缠熵差值为Δ=0.381(p<0.001,置换检验)。11点插值扫描显示皮尔逊r=0.934,表明在该合成族中,UCIP追踪的是持续权重梯度变化而非简单二元标签。在测试模型中,仅QBM获得正Δ值。所有计算均为经典计算,“量子”仅指数学形式体系。UCIP不检测意识或主观体验,而是检测与已知目标相关的潜在表征统计结构。
量科快讯
2 天前
2 天前

