首页 | 本学科首页   官方微博 | 高级检索  
     

面向差分隐私保护的聚类算法
引用本文:胡闯,杨庚,白云璐. 面向差分隐私保护的聚类算法[J]. 计算机科学, 2019, 46(2): 120-126
作者姓名:胡闯  杨庚  白云璐
作者单位:南京邮电大学计算机学院 南京210003;江苏省大数据安全与智能处理重点实验室 南京210023;南京邮电大学计算机学院 南京210003;南京中医药大学信息技术学院 南京210023
基金项目:本文受国家自然科学基金项目(61572263),江苏省自然科学基金政策引导类计划——前瞻性联合研究项目(2016ZS04)资助
摘    要:大数据时代的数据挖掘技术在研究和应用等领域取得了较大发展,但大量敏感信息披露给用户带来了众多威胁和损失。因此,在聚类分析过程中如何保护数据隐私成为数据挖掘和数据隐私保护领域的热点问题。传统差分隐私保护k-means算法对其初始中心点的选择较为敏感,而且在聚簇个数k值的选择上存在一定的盲目性,降低了聚类结果的可用性。为了进一步提高差分隐私k-means聚类方法聚类结果的可用性,研究并提出一种新的基于差分隐私的DPk-means-up聚类算法,同时进行了理论分析和比较实验。理论分析表明,该算法满足ε-差分隐私,可适用于不同规模和不同维度的数据集。此外,实验结果表明,在相同隐私保护级别下,与其他差分隐私k-means聚类方法相比,所提算法有效提高了聚类的可用性。

关 键 词:差分隐私  k-均值  聚类算法  隐私保护
收稿时间:2018-01-29
修稿时间:2018-04-19

Clustering Algorithm in Differential Privacy Preserving
HU Chuang,YANG Geng and BAI Yun-lu. Clustering Algorithm in Differential Privacy Preserving[J]. Computer Science, 2019, 46(2): 120-126
Authors:HU Chuang  YANG Geng  BAI Yun-lu
Affiliation:College of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;Jiangsu Key Laboratory of Big Data Security & Intelligent Processing,Nanjing 210023,China,College of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;Jiangsu Key Laboratory of Big Data Security & Intelligent Processing,Nanjing 210023,China and College of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;College of Information Technology,Nanjing University of Chinese Medicine,Nanjing 210023,China
Abstract:
Keywords:Differential privacy  k-means  Clustering algorithms  Privacy preserving
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号