基于生成对抗网络技术的医疗仿真数据生成方法OA北大核心CSTPCD
对结构化电子健康档案中行的概率分布进行建模并生成仿真数据非常困难,因为表格数据通常包含定类列,传统编码方式可能产生特征维数灾难的问题,从而使建模异常困难。针对这一问题,提出利用庞加莱球模型建模医疗分类特征的层级结构,并采用高斯耦合的生成对抗网络技术合成结构化的电子健康档案。实验表明,该方法生成的训练数据能够在保证隐私性的前提下,实现与原始数据仅相差2%的可用性差异。
向夏雨;王佳慧;王子睿;段少明;潘鹤中;庄荣飞;韩培义;刘川意
北京邮电大学网络空间安全学院,北京100876国家信息中心信息与网络安全部,北京100045哈尔滨工业大学(深圳)计算机科学与技术学院,广东深圳518055哈尔滨工业大学(深圳)计算机科学与技术学院,广东深圳518055北京邮电大学网络空间安全学院,北京100876哈尔滨工业大学(深圳)计算机科学与技术学院,广东深圳518055哈尔滨工业大学(深圳)计算机科学与技术学院,广东深圳518055 鹏城实验室网络部,广东深圳518066哈尔滨工业大学(深圳)计算机科学与技术学院,广东深圳518055 鹏城实验室网络部,广东深圳518066
信息技术与安全科学
生成对抗网络表示学习隐私性与可用性分析电子健康档案
《通信学报》 2022 (3)
P.211-224,14
评论