K-Modes聚类数据收集和发布过程中的混洗差分隐私保护方法OA北大核心CSTPCD
针对目前聚类数据收集与发布安全性不足的问题,为保护聚类数据中的用户隐私并提高数据质量,基于混洗差分隐私模型,提出一种去可信第三方的K-Modes聚类数据收集和发布的隐私保护方法。首先,使用K-Modes聚类数据收集算法对用户数据进行采样并加噪,再通过填补取值域随机排列发布算法打乱采样数据的初始顺序,使恶意攻击者不能根据用户与数据之间的关系识别出目标用户。然后,尽可能减小噪声的干扰,利用循环迭代的方式计算出新的质心完成聚类。最后,从理论层面上分析了以上3种方法的隐私性、可行性和复杂度,并利用3个真实数据集和近年来具有权威性的同类算法KM、DPLM、LDPKM等进行准确率、熵值的对比,验证所提方法的有效性。实验结果表明,所提方法的隐私保护和发布数据质量均优于当前同类算法。
蒋伟进;陈艺琳;韩裕清;吴玉庭;周为;王海娟;
湖南工商大学计算机学院,湖南长沙410205 武汉理工大学计算机与人工智能学院,湖北武汉430070 湘江实验室,湖南长沙410205湖南工商大学计算机学院,湖南长沙410205 湘江实验室,湖南长沙410205湘江实验室,湖南长沙410205 湖南工商大学前沿交叉学院,湖南长沙410205
计算机与自动化
混洗差分隐私K-Modes聚类隐私保护数据收集数据发布
《通信学报》 2024 (001)
P.201-213 / 13
国家自然科学基金资助项目(No.72088101,No.61772196);湖南省自然科学基金重点资助项目(No.2020JJ4249);新零售虚拟现实技术湖南省重点实验室基金资助项目(No.2017TP1026);湖南省教育厅科学研究重点基金资助项目(No.21A0374);湖南省学位与研究生教学改革基金资助项目(No.2022JGYB194)。
评论