基于联合树的隐私高维数据发布方法 |
| |
引用本文: | 张啸剑, 陈莉, 金凯忠, 孟小峰. 基于联合树的隐私高维数据发布方法[J]. 计算机研究与发展, 2018, 55(12): 2794-2809. DOI: 10.7544/issn1000-1239.2018.20170756 |
| |
作者姓名: | 张啸剑 陈莉 金凯忠 孟小峰 |
| |
作者单位: | 1(河南财经政法大学计算机与信息工程学院 郑州 450002);2(河南财经政法大学网络信息安全研究所 郑州 450046);3(中国人民大学信息学院 北京 100872) (xjzhang82@ruc.edu.cn) |
| |
基金项目: | 国家自然科学基金项目(61502146,91646203,91746115,61772131);河南省自然科学基金项目(162300410006);河南省科技攻关项目(172102310713);河南省教育厅高等学校重点科研项目(16A520002);河南财经政法大学青年拔尖人才资助计划项目 |
| |
摘 要: | 基于差分隐私的数据发布已得到研究者的广泛关注.然而,现有的发布方法却不能有效地处理高维数据,其原因在于维度灾难和值域多样会引入极大的噪音值,进而使得发布结果的可用性比较低.基于此,提出一种基于联合树的隐私高维数据发布方法PrivHD(differentially private high dimensional data release),该方法通过指数机制构造Markov网,引入满足差分隐私的高通滤波技术缩减指数机制搜索空间.结合充分三角化操作和顶点消除操作对Markov网分割来获得完全团图,采用最大生成树方法生成满足差分隐私的联合树.利用联合树中各个团后置处理之后的联合分布表合成最终的高维数据.基于真实的高维数据集比较PrivHD算法与PrivBayes(private Bayesian network),JTree(junction tree)算法的精度,实验结果表明:PrivHD算法的k-way查询和SVM(support vector machine)分类精度优于同类算法.
|
关 键 词: | 高维数据 差分隐私 Markov网 联合树 边缘分布 |
|
| 点击此处可从《计算机研究与发展》浏览原始摘要信息 |
|
点击此处可从《计算机研究与发展》下载免费的PDF全文 |
|