经典与量子核融合实现精准稳健的双样本检验
两样本检验已被广泛应用于各科学领域及机器学习中,如评估药物有效性和不同营销策略的A/B测试,以判别两组样本是否来自同一分布。基于核的假设检验方法通过将数据嵌入再生核希尔伯特空间(RKHS),能以模型无关的方式有效解析高维复杂数据结构并获得准确结果。虽然核函数的选择对其性能至关重要,但学界对如何选择核函数(尤其针对小数据集)仍知之甚少。本研究旨在基于最大均值差异(MMD)的核检验理论基础,构建一种对小数据集仍有效的假设检验方法MMD-FUSE。为此,该团队通过引入量子核增强MMD-FUSE框架,并提出融合经典核与量子核的新型混合检验策略。该方法结合经典核的领域特定归纳偏置与量子核的独特表达能力,形成强大且自适应的检验机制。研究团队在多种合成数据集和真实临床数据集上评估该方法,实验揭示两个关键发现:1)经适当超参数调优后,采用量子核的MMD-FUSE始终较经典核方法提升检验功效,尤其对小样本高维数据;2)所提出的混合框架展现出显著鲁棒性,能适应不同数据特征并在多样场景中保持高检验功效。这些结果表明,量子启发式与混合核策略有望构建更有效的统计检验方法,为样本量受限的数据分析提供通用工具。



