首页 | 本学科首页   官方微博 | 高级检索  
     

基于差分隐私的多源数据关联规则挖掘方法
引用本文:崔一辉,宋伟,彭智勇,杨先娣.基于差分隐私的多源数据关联规则挖掘方法[J].计算机科学,2018,45(6):36-40, 56.
作者姓名:崔一辉  宋伟  彭智勇  杨先娣
作者单位:武汉大学计算机学院 武汉430072,武汉大学计算机学院 武汉430072,武汉大学计算机学院 武汉430072,武汉大学计算机学院 武汉430072
基金项目:本文受国家自然科学基金(61232002,8,61202034),湖南省自然科学基金面上项目(2017CFB420),CCF中文信息技术开放课题基金(CCF2014-01-02),武汉市创新团队项目(2014070504020237),武汉大学自主科研项目(2042016gf0020,2016-2017)资助
摘    要:随着大数据时代的到来,挖掘大数据的潜在价值越来越受到学术界和工业界的关注。但与此同时,由于互联网安全事件频发,用户越来越多地关注个人隐私数据的泄露问题,用户数据的安全问题成为阻碍大数据分析的首要问题之一。关于用户数据的安全性问题,现有研究更多地关注访问控制、密文检索和结果验证,虽然可以保证用户数据本身的安全性,但是无法挖掘出所保护数据的潜在价值。如何既能保护用户的数据安全又能挖掘数据的潜在价值,是亟需解决的关键问题之一。文中提出了一种基于差分隐私保护的关联规则挖掘方法,数据拥有者使用拉普拉斯机制和指数机制在数据发布的过程中对用户数据进行保护,数据分析者在差分隐私的FP-tree上进行关联规则挖掘。其中的安全性假设是:攻击者即使掌握了除攻击目标以外的所有元组数据信息的背景知识,仍旧无法获得攻击目标的信息,因此具有极高的安全性。所提方法是兼顾安全性、性能和准确性,以牺牲部分精确率为代价,大幅增加了用户数据的安全性和处理性能。实验结果表明,所提方法的精确性损失在可接受的范围内,性能优于已有算法的性能。

关 键 词:隐私保护的数据挖掘  差分隐私  拉普拉斯机制  指数机制
收稿时间:2017/3/11 0:00:00
修稿时间:2017/5/19 0:00:00

Mining Method of Association Rules Based on Differential Privacy
CUI Yi-hui,SONG Wei,PENG Zhi-yong and YANG Xian-di.Mining Method of Association Rules Based on Differential Privacy[J].Computer Science,2018,45(6):36-40, 56.
Authors:CUI Yi-hui  SONG Wei  PENG Zhi-yong and YANG Xian-di
Affiliation:Computer School,Wuhan University,Wuhan 430072,China,Computer School,Wuhan University,Wuhan 430072,China,Computer School,Wuhan University,Wuhan 430072,China and Computer School,Wuhan University,Wuhan 430072,China
Abstract:With the advent of the era big data,the potential value of mining big data has attracted more and more attention from academia and industry.However,at the same time,due to frequent Internet security incidents,users are increasingly concerned about the disclosure of personal privacy data,and user data security issues become one of the most important obstacles to big data analysis.With regard to the study of user data security,the existing researches more focus on access control,ciphertext retrieval and result verification.The above researches can guarantee the security of user data itself,but can not dig out the potential value of protected data.Therefore,how to protect the security and dig the potential value of the data in the meantime is one of the key issues that need to be addressed.This paper proposed an association rules mining method based on differential privacy protection.Data owners use Laplacian mechanism and exponential mechanism to protect user data during data release.Data analysis is associated with differential privacy FP-tree Rule mining.The experimental results show that the performance and accuracy of the proposed method are superior to the existing methods.
Keywords:Privacy preserving data mining  Differential privacy  Laplace mechanism  Exponential mechanism
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号