首页 | 本学科首页   官方微博 | 高级检索  
     

基于邻域属性熵的隐私保护数据干扰方法
引用本文:倪巍伟,徐立臻,崇志宏,吴英杰,刘腾腾,孙志挥.基于邻域属性熵的隐私保护数据干扰方法[J].计算机研究与发展,2009,46(3).
作者姓名:倪巍伟  徐立臻  崇志宏  吴英杰  刘腾腾  孙志挥
作者单位:东南大学计算机科学与工程学院,南京,210096
基金项目:江苏省自然科学基金,教育部高等学校博士学科点专项科研基金 
摘    要:隐私保护微数据发布是数据隐私保护研究的一个热点,数据干扰是隐私保护微数据发布采用的一种有效解决方法.针对隐私保护聚类问题,提出一种隐私保护数据干扰方法NETPA,NETPA干扰方法通过对数据点及邻域点集的分析,借助信息论中熵的理论,提出邻域属性熵和邻域主属性等概念,对原始数据中数据点的邻域主属性值用其k邻域点集内数据点在该属性的均值进行干扰替换,在较好地维持原始数据k邻域关系的情况下达到保护原始数据隐私不泄露的目的.理论分析表明,NETPA干扰方法具有良好地避免隐私泄露的效果,同时可以较好地维持原始数据的聚类模式.实验采用DBSCAN和k-LDCHD聚类算法对干扰前后的数据进行聚类分析比对.实验结果表明,干扰前后数据聚类结果具有较高的相似度,算法是有效可行的.

关 键 词:隐私保护  聚类挖掘  邻域属性熵  邻域主属性  数据干扰

A Privacy-Preserving Data Perturbation Algorithm Based on Neighborhood Entropy
Ni Weiwei,Xu Lizhen,Chong Zhihong,Wu Yingjie,Liu Tengteng,Sun Zhihui.A Privacy-Preserving Data Perturbation Algorithm Based on Neighborhood Entropy[J].Journal of Computer Research and Development,2009,46(3).
Authors:Ni Weiwei  Xu Lizhen  Chong Zhihong  Wu Yingjie  Liu Tengteng  Sun Zhihui
Affiliation:School of Computer Science and Engineering;Southeast University;Nanjing 210096
Abstract:Privacy preserving micro-data publishing is a hot issue in data privacy preserving research.Data perturbation is one of those methods to solve this problem,which does some revision to primitive data values at the cost of little mining accuracy loss.The key is the balance between privacy preserving and mining accuracy,which contradict each other to some extent.Concerning the problem of privacy preserving clustering,a novel privacy preserving data perturbation algorithm NETPA is proposed.The potential relatio...
Keywords:privacy preserving  clustering  neighborhood entropy of attribute  neighboring main attribute  data perturbation  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号