TabularQGAN:面向表格数据的量子生成模型

在本研究中,该团队提出了一种用于合成表格数据的创新型量子生成模型。合成数据在真实数据稀缺或隐私敏感场景中具有重要价值,可用于扩增或替代现有数据集。现实企业数据主要是异构表格形式,通常包含分类与数值特征的混合体,与医疗健康、金融和软件等行业高度相关。研究人员设计了一种具有灵活数据编码方案的量子生成对抗网络架构,并采用新型量子线路构造方法,实现对表格数据的有效建模。该工作基于MIMIC III医疗数据集和成人人口普查数据集进行测试,与主流经典模型CTGAN、CopulaGAN进行了全面基准对比。实验结果表明,在使用参数仅为经典模型0.072%的情况下,量子模型在SDMetrics综合相似度评分中平均优于经典模型8.5%。研究团队还通过两个定制化评估指标验证了模型的泛化能力,证明所提量子模型能生成兼具实用性和新颖性的样本。据该团队所知,这是首批成功处理表格数据的量子生成模型之一,表明此类任务可能特别适合量子计算机处理。

量科快讯