基于生成对抗网络的差分隐私数据发布方法OA北大核心CSCDCSTPCD
Differential Private Data Publishing Method Based on Generative Adversarial Network
机器学习的飞速发展使其成为数据挖掘领域最有效的工具之一,但算法的训练过程往往需要大量的用户数据,给用户带来了极大的隐私泄漏风险.由于数据统计特征的复杂性及语义丰富性,传统隐私数据发布方法往往需要对原始数据进行过度清洗,导致数据可用性低而难以再适用于数据挖掘任务.为此,提出了一种基于生成对抗网络(Generative Adversarial Network,GAN)的差分隐私数据发布方法,通过在GAN模型训练的梯度上添加精心设计的噪声来实现差分隐私,确保GAN可无限量生成符合源数据统计特性且不泄露隐私的合成数据.针对现有同类方法合成数据质量低、模型收敛缓慢等问题,设计多种优化策略来灵活调整隐私预算分配并减小总体噪声规模,同时从理论上证明了合成数据严格满足差分隐私特性.在公开数据集上与现有方法进行实验对比,结果表明本方法能够更高效地生成质量更高的隐私保护数据,适用于多种数据分析任务.
方晨;郭渊博;王娜;甄帅辉;唐国栋
信息工程大学,河南郑州450001信息工程大学,河南郑州450001信息工程大学,河南郑州450001信息工程大学,河南郑州450001中国人民解放军93808部队,甘肃兰州730000
信息技术与安全科学
差分隐私生成对抗网络隐私数据发布合成数据数据挖掘
《电子学报》 2020 (10)
基于格的认证密钥交换协议研究
1983-1992,10
国家自然科学基金(No.61501515,No.61601515)信息保障技术重点实验室开放基金(No.KJ-15-108)
评论