首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
如何在数据挖掘的过程中保护私有信息,并且获得更为准确的挖掘结果成为数据挖掘领域中一个非常有意义的研究课题.在MASK(Mining Associations with Secrecy Constraints)算法的基础上提出了一种改进的基于随机扰动的隐私保护挖掘算法RPM(Random Perturbation MAS...  相似文献   

2.
电动汽车频繁接入充电桩充电而产生的位置数据对优化充电桩布置、指导电力调度具有重要意义。然而充电位置数据对于汽车用户来说属于隐私信息。为防止汽车用户的隐私泄露,亟需探索研究隐私汇聚充电位置数据的方法。采用局部差分隐私技术保护电动汽车充电位置数据,通过引入贝叶斯随机多伪隐私算法设计一种基于分区的隐私保护充电位置数据汇聚方法。该方法利用贝叶斯随机多伪隐私算法设计了一个用于本地化扰动充电位置数据的局部混淆算法,然后,结合随机多伪算法的重构算法设计了满足稀疏、样本量小等特点的充电位置数据的隐私汇聚方法。同时,在保证隐私保护水平的前提下,通过对位置域进行划分以缩小隐私位置域,进一步提高汇聚结果的可用性。对所设计方法的隐私性进行分析。最后,在正态分布、均匀分布、峰值分布和随机分布4种不同的合成数据集以及公开的Gowalla数据集上进行验证。实验结果表明:在相同隐私水平的条件下,所设计的方法在可用性方面优于基于随机映射矩阵的隐私汇聚方法。  相似文献   

3.
针对垂直分布下的隐私保护关联规则挖掘算法效率低、安全性不高的问题,提出一种隐私保护频繁闭合项集的挖掘算法。算法利用挖掘频繁闭合项集代替频繁项集,IT-Tree作为搜索空间,Diffsets作为压缩结构,采用基于RSA可交换加密算法的隐私保护集合差集协议。实验结果表明,算法具有较好的隐私性、准确性、高效性。  相似文献   

4.
针对智能电网环境下个体数据的差分隐私与聚合数据实用性的均衡问题,提出基于近似耗电分组的差分隐私算法,通过降低组内耗电值的最大敏感度,降低整体差分隐私噪音,提高聚合数据对于供电方的实用性;针对内部节点攻击个体电表数据的问题,通过构建分布式加密聚合平台,抵御包括控制中心在内的内部节点对个体细粒度数据的攻击;解决由于故障电表的存在所导致的分布式聚合方案不能正确解密同态加密聚合值以及非故障电表添加的噪音值不能满足整体差分噪音量需求这2个问题. 实验证明所提出的基于近似耗电分组的算法与预估故障率设定差分噪音的方法的结合,相比其他相近方案,在提高聚合数据实用性方面有明显提升,同时分布式加密聚合平台为抵御内部节点攻击以及支持加密容错和差分容错提供了轻量级保证.  相似文献   

5.
为了解决维度灾难所引起的隐私保护数据发布计算复杂度高、可用性低的问题,提出基于差分隐私采样机制和贝叶斯网络的DPSM-Bayes算法。利用贝叶斯网络模型,将高维联合概率分布转化为多个低维边缘概率分布,结合差分隐私采样机制和更适合高维概率分布加噪的IMLaplace机制,生成可用性更高的高维合成数据集。实验结果证明,在提供相同差分隐私保护的前提下,DPSM-Bayes算法能够有效地处理高维数据集的发布问题,与现有的方法相比发布的数据集具有更高的质量和可用性。  相似文献   

6.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

7.
聚类挖掘可以高效准确地从数据中找出很多潜在的、有价值的规律,但也同时存在着泄露用户隐私数据的安全威胁.已经有一些专门针对聚类挖掘的隐私保护研究,其中乘法扰动方法是一种准确性和安全性都较高的隐私保护算法.研究发现已知信息独立分量分析极大地降低了已有乘法扰动方法的安全性,它能够从乘法扰动数据中近似估计隐私数据.为了解决以上问题,提出了局部旋转扰动隐私保护算法,通过准确性分析得出新算法具有零损失准确性.利用安全性分析证明新算法能够有效抵御独立分量分析的攻击,具有更高的安全性.将新算法应用到聚类挖掘中,得到了与未加隐私保护的聚类挖掘非常接近的结果,说明了它的可行性.局部旋转扰动方法的出现,有效地解决了已有乘法扰动方法的安全漏洞,使得聚类挖掘能够更加安全地得到应用.  相似文献   

8.
9.
基于位置的各种大数据服务在为用户提供便利的同时,也导致了各种隐私泄露的风险。本地化差分隐私模型避免了对可信第三方数据收集平台的依赖,使得用户能够依据个人需求处理和保护敏感信息,因此更适用于位置隐私保护的场景。针对现有本地化差分隐私位置保护方法编码机制复杂、位置数据可用性低等问题,提出一种基于希尔伯特编码的本地化差分隐私位置保护方法。用户端根据本地化差分隐私模型对自身所处网格的希尔伯特编码进行随机响应扰动处理,实现原始位置的隐私保护;服务器端收集大量用户的扰动位置编码并进行希尔伯特解码,进而判断用户所处的网格位置,实现对用户数量和分布密度的统计分析。通过实际位置数据集合上的实验证明,所提方法能够在实现用户位置本地化差分隐私保护的基础上提供更好的位置数据可用性和运行效率。  相似文献   

10.
针对基于位置服务中移动终端用户轨迹隐私安全及用户个性化需求的问题,提出一种个性化差分隐私的k匿名轨迹隐私保护方案。所提方案根据用户的个性化差异分配不同的隐私预算,利用差分隐私技术对用户轨迹多次添加拉普拉斯噪声,生成2k个噪声轨迹;利用轨迹相似性度量方法确定最优的k-1个噪声用户,将其与真实用户组成k匿名用户组,然后随机选取一个代理用户代替真实用户执行位置服务请求,从而实现对用户身份和轨迹的隐私性保护。通过安全性分析得出方案具有匿名性、不可伪造性和抗假冒攻击等安全特性。仿真实验结果表明,所提方案在隐私保护效果上有明显的优势,且具有较高的执行效率。  相似文献   

11.
基于差分隐私下包外估计的随机森林算法   总被引:1,自引:0,他引:1  
针对差分隐私随机森林算法在对高维数据进行分类时准确率不理想的问题,本文通过引入差分隐私下的包外估计来计算决策树权重以及特征权重,从而提出一种基于差分隐私下包外估计的随机森林算法(random forest under differential priva-cy based on the out-of-bag estim...  相似文献   

12.
为解决现有基于网格结构的差分隐私二维空间数据划分发布方法可能引起局部划分过细导致查询精度低的问题,提出了基于kd-树的差分隐私二维空间数据划分发布方法-kd-PPDP算法(differentially privacy partitioning publication algorithm based on kd-tree)。算法采用了kd-树算法思想,通过启发式地识别网格化后数据分布情况并合并相邻近似网格单元来防止局部划分过细问题,从而减少所添加的噪声,提高查询精度。通过实验对比分析了kd-PPDP算法与现有基于网格结构的划分发布方法的查询误差以及时间效率,结果表明了该算法的有效性和可行性。  相似文献   

13.
传统的社交网络差分隐私保护方法由于直接对隐私数据进行了分类,导致方法的应用效果不佳。因此,设计一种基于生成对抗网络反馈的社交网络差分隐私保护方法。通过计算差分隐私的预算参数,构建差分隐私风险量化模型,对数据隐私泄露的风险量化。在生成对抗网络反馈的作用下,将隐私数据分类过程划分为数据分类和判别过程,通过计算隐私数据的信息熵,提高数据分类的精确度,实现社交网络差分隐私的保护。和以往的社交网络差分隐私保护方法相比,本文设计的基于生成对抗网络反馈的社交网络差分隐私保护方法的执行时间平均为123.2 ms,执行时间更短,应用效果更好。  相似文献   

14.
基于DCGAN反馈的深度差分隐私保护方法   总被引:2,自引:0,他引:2  
为了防止攻击者在深度学习模型应用过程中利用生成式对抗网络(generative adversarial networks,GAN)等技术还原出训练集中的数据,保护训练数据集中用户的敏感信息,提出一个基于深度卷积生成式对抗网络(deep convolutional generative adversarial networks,DCGAN)反馈的深度差分隐私保护方法.该方法在深度网络参数优化计算时结合差分隐私理论添加噪声数据,基于差分隐私与高斯分布可组合特点,计算深度网络每一层的隐私预算,在随机梯度下降(stochastic gradient descent,SGD)计算中添加高斯噪声使之总体隐私预算最小;利用DCGAN生成数据选取可能得到的最优结果,通过对比攻击结果和原始数据之间的差别调节深度差分隐私模型参数,实现训练数据集可用性与隐私保护度的平衡.实验结果表明,该方法针对训练数据集中的敏感信息具有较高的隐私保护能力.  相似文献   

15.
随着海量数据不断涌入,SVM隐私泄露问题日益严重。在分析已有隐私保护支持向量机基础上,提出一种面向大规模数据的隐私保护学习机(PPLM)。该方法首先通过核心向量机对大规模样本进行采样,然后在核心集上选取两个样本点并将两点连线的法平面作为最优分类面。通过对标准数据集和人工数据集的实验表明,PPLM可有效地解决大规模样本分类问题,且分类效果良好。  相似文献   

16.
在不泄露隐私信息或敏感知识的基础下,如何挖掘出分布式数据中准确的规则信息,已成为数据挖掘领域的重要研究方向之一。本文总结了面向分布式数据挖掘的隐私保护技术的现状,并比较分析了不同方法的优缺点,另外还提出了面向数据挖掘隐私保护技术的性能评估标准,展望了未来进一步的研究方向。  相似文献   

17.
随着数据挖掘应用领域的扩大,隐私保护的数据挖掘技术研究变得越来越重要.作为隐私保护数据挖掘的主要类型——隐私保护的分类数据挖掘已经成为近年来数据挖掘领域的热点之一.如何对原始数据进行变换,然后在变换后的数据集上构造判定树是隐私保护分类数据挖掘研究的重点.基于随机扰动矩阵提出一种隐私保护分类挖掘算法.该方法适用于字符型、布尔类型、分类类型和数字类型的离散数据,并且在隐私信息的保护度和挖掘结果的准确度上都有很大的提高.  相似文献   

18.
由于权重社交网络的复杂性和噪声随机性,传统的隐私保护方法无法兼顾社交网络中的隐私和效用需求.针对此问题,融合直方图统计和非交互式差分隐私查询模型,提出社交网络边权重直方图统计发布方法.该方法将边权重统计直方图作为查询结果,并设计低敏感度的边权重拉普拉斯噪声随机扰动算法,实现社交关系的差分隐私保护.为减少噪声量,引入社区...  相似文献   

19.
协同过滤推荐算法在工作过程中需要分析和使用大量的用户数据,存在个人隐私泄露的安全隐患。现有的大多数在推荐系统中实施隐私保护的方法,容易引入过大噪声,导致推荐质量下降。针对此问题,该文提出一种满足差分隐私保护的矩阵分解推荐算法。该算法首先将矩阵分解问题转化为两个交替进行的用户隐因子和项目隐因子优化问题,然后采用遗传算法对这两个优化问题进行求解。将增强指数机制融入到遗传算法的个体选择中,并基于寻找重要隐因子的思想设计了遗传算法的变异过程。理论分析和实验结果显示,该算法可以为用户数据提供良好的差分隐私保护,同时有效保证了推荐的准确性,在推荐系统中具有良好的应用价值。  相似文献   

20.
为提高差分隐私保护下推荐算法的准确性,提出了一种考虑差分隐私保护的基于Bhattacharyya系数(BC)的聚类推荐算法.以BC作为项目相似性度量的标准,根据BC相似性对项目进行K-medoids聚类,并在聚类簇中进行私有项目邻居选择.最后,根据最近邻居集信息,对用户的评分进行预测和Top-n推荐.提出的方案有效地克服了已有方法中存在的相似性度量依赖于共同评分的问题,提高了相似性度量的准确性,有效避免了因隐私保护而造成的最近邻居集质量下降的问题.理论分析和实验测试的结果表明,该方法在实现隐私保护的同时还能有效保证推荐的高质量,较好地实现了隐私保护和数据效用之间的平衡,具有良好的应用潜力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号