利用张量网络的矩阵乘积态(MPS)进行合成数据生成与差分隐私保护

合成数据生成是现代人工智能的一项关键技术,能够有效解决数据稀缺性、隐私约束以及构建稳健模型所需多样化数据集等问题。该研究团队提出了一种基于张量网络(特别是矩阵乘积态MPS)的隐私保护高质量表格数据生成方法。通过将基于MPS的生成模型与CTGAN、VAE和PrivBayes等前沿模型进行基准测试,研究人员重点评估了数据保真度与隐私保护能力。为实现差分隐私(DP),该工作创新性地在训练过程中集成噪声注入和梯度裁剪技术,并通过Rényi差分隐私核算机制提供隐私保障。在分析数据保真度与下游机器学习任务性能的多项指标中,实验结果表明MPS模型优于传统方案,尤其在严格隐私约束条件下表现突出。 该工作凸显了MPS作为隐私敏感型合成数据生成工具的潜力。通过将张量网络表示的表达能力与形式化隐私机制相结合,所提出的方法为安全数据共享提供了兼具可解释性与可扩展性的新范式。其结构化设计便于集成到数据质量与保密性要求并重的敏感领域,包括但不限于医疗健康、金融风控等关键行业应用。
作者所在地: VIP可见
提交arXiv: 2025-08-08 12:14

量科快讯