首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
轨迹隐私保护中使用k-means算法进行聚类时,对初始值敏感,且聚簇数目的选择具有一定的盲目性,为解决该问题并提高聚类结果的可用性,提出一种结合k-shape和差分隐私的轨迹隐私保护方案KSDP(k-shape differential privacy).首先,对轨迹数据进行划分切割预处理,利用轨迹的时间属性和空间属性对轨迹切割划分,从而提高聚类泛化的质量.其次,使用设定的效用函数对预处理后的轨迹数据进行评判,并对过滤后数据进行聚类泛化操作.最后,在泛化后的数据中加入Laplace噪声,使其满足差分隐私保护模型,进一步保护轨迹隐私.实验仿真结果表明,与传统差分隐私k-means聚类方案对比,KSDP方案有效提高了聚类结果的可用性,并具有一定的性能优势,更好地实现了轨迹数据发布和隐私保护.  相似文献   

2.
为了解决维度灾难所引起的隐私保护数据发布计算复杂度高、可用性低的问题,提出基于差分隐私采样机制和贝叶斯网络的DPSM-Bayes算法。利用贝叶斯网络模型,将高维联合概率分布转化为多个低维边缘概率分布,结合差分隐私采样机制和更适合高维概率分布加噪的IMLaplace机制,生成可用性更高的高维合成数据集。实验结果证明,在提供相同差分隐私保护的前提下,DPSM-Bayes算法能够有效地处理高维数据集的发布问题,与现有的方法相比发布的数据集具有更高的质量和可用性。  相似文献   

3.
查询日志的发布会泄露用户的隐私。提出一种基于差分隐私的查询日志匿名化算法:首先构建用户查询项模型进行相似度计算并利用所求结果对用户查询项模型进行聚类,其次在聚类过程中添加指数噪音来满足差分隐私,最后发布匿名化数据。实验表明:该算法有效地提高了查询日志的实用性和隐私保护程度。  相似文献   

4.
为解决现有基于网格结构的差分隐私二维空间数据划分发布方法可能引起局部划分过细导致查询精度低的问题,提出了基于kd-树的差分隐私二维空间数据划分发布方法-kd-PPDP算法(differentially privacy partitioning publication algorithm based on kd-tree)。算法采用了kd-树算法思想,通过启发式地识别网格化后数据分布情况并合并相邻近似网格单元来防止局部划分过细问题,从而减少所添加的噪声,提高查询精度。通过实验对比分析了kd-PPDP算法与现有基于网格结构的划分发布方法的查询误差以及时间效率,结果表明了该算法的有效性和可行性。  相似文献   

5.
为解决大数据中个性化检索技术所潜在的用户隐私安全和提升个性化信息检索性能之间的矛盾,提出了基于差分隐私与p-link技术相结合的用户兴趣模型匿名化方法.首先对用户的准标示符进行泛化并添加噪音满足差分隐私保护要求,最大化统计数据库中的查询精度,同时最小化识别个体及属性的概率;其次根据用户兴趣之间的相似性将其微聚为满足p-link的等价组,并计算微聚后等价组兴趣条目的权值和等价组质心;最后发布匿名化的数据.大量实验证明:该方法结合差分隐私与p-link两者的特性,实现用户兴趣模型匿名化且用户兴趣基本不发生改变,既能保护用户的隐私信息,又能保证个性化检索性能.  相似文献   

6.
为提高差分隐私保护下推荐算法的准确性,提出了一种考虑差分隐私保护的基于Bhattacharyya系数(BC)的聚类推荐算法.以BC作为项目相似性度量的标准,根据BC相似性对项目进行K-medoids聚类,并在聚类簇中进行私有项目邻居选择.最后,根据最近邻居集信息,对用户的评分进行预测和Top-n推荐.提出的方案有效地克服了已有方法中存在的相似性度量依赖于共同评分的问题,提高了相似性度量的准确性,有效避免了因隐私保护而造成的最近邻居集质量下降的问题.理论分析和实验测试的结果表明,该方法在实现隐私保护的同时还能有效保证推荐的高质量,较好地实现了隐私保护和数据效用之间的平衡,具有良好的应用潜力.  相似文献   

7.
协同过滤推荐算法在工作过程中需要分析和使用大量的用户数据,存在个人隐私泄露的安全隐患。现有的大多数在推荐系统中实施隐私保护的方法,容易引入过大噪声,导致推荐质量下降。针对此问题,该文提出一种满足差分隐私保护的矩阵分解推荐算法。该算法首先将矩阵分解问题转化为两个交替进行的用户隐因子和项目隐因子优化问题,然后采用遗传算法对这两个优化问题进行求解。将增强指数机制融入到遗传算法的个体选择中,并基于寻找重要隐因子的思想设计了遗传算法的变异过程。理论分析和实验结果显示,该算法可以为用户数据提供良好的差分隐私保护,同时有效保证了推荐的准确性,在推荐系统中具有良好的应用价值。  相似文献   

8.
针对高维相关数据发布的隐私保护问题,本文提出2种隐私保护数据发布方法,解决高维相关数据发布时重复加噪导致的发布数据效用过低问题.基于概率主成分分析模型的隐私数据发布方法,及基于概率主成分分析和差分隐私的数据发布方法,利用主成分分析对高维数据降维,在低维数据中加入拉普拉斯噪声,然后再由概率主成分分析的生成模型生成数据集发...  相似文献   

9.
现有发布轨迹隐私保护方法没有考虑实际路网环境中轨迹的时空约束条件,不能对用户的轨迹隐私进行有效保护,导致轨迹隐私存在安全隐患.针对此问题,提出一种面向路网时空约束的轨迹隐私保护算法(TPPST),保护发布轨迹隐私安全.TPPST算法通过生成满足路网时空约束条件且与用户原始轨迹相似的假轨迹,将原始轨迹与假轨迹共同发布,从...  相似文献   

10.
针对轨迹隐私保护的个性化需求问题,提出一种基于典型相关分析的个性化轨迹隐私保护算法。算法对数据产生者认为不敏感的轨迹直接发布,而仅对数据产生者认为敏感的轨迹施以隐私保护操作。隐私保护过程中,先由不敏感轨迹和敏感轨迹获得二者的隐变量,再根据隐变量产生随机轨迹以替代敏感轨迹。该算法不仅能较好地尊重数据产生者的隐私保护意愿,而且能获得较高的轨迹质量。在真实轨迹数据上的实验结果验证了算法的有效性。  相似文献   

11.
针对基于位置服务中移动终端用户轨迹隐私安全及用户个性化需求的问题,提出一种个性化差分隐私的k匿名轨迹隐私保护方案。所提方案根据用户的个性化差异分配不同的隐私预算,利用差分隐私技术对用户轨迹多次添加拉普拉斯噪声,生成2k个噪声轨迹;利用轨迹相似性度量方法确定最优的k-1个噪声用户,将其与真实用户组成k匿名用户组,然后随机选取一个代理用户代替真实用户执行位置服务请求,从而实现对用户身份和轨迹的隐私性保护。通过安全性分析得出方案具有匿名性、不可伪造性和抗假冒攻击等安全特性。仿真实验结果表明,所提方案在隐私保护效果上有明显的优势,且具有较高的执行效率。  相似文献   

12.
KACA是一种基于局域泛化的K-匿名化方法.基于该算法,结合敏感属性隐私保护度,提出了一种S-KACA算法.该算法能够更有针对性地保护敏感隐私属性,而且使发布后数据的可用性较高,但由于其在保护敏感隐私信息时设置了一个隐私保护度的参数,会影响算法执行效率,使大规模的数据集应用有一定的局限性.为解决这个问题,引入一个高效的聚类算法——K-Prototypes算法,并将其与S-KACA算法相结合,提出一种K-Prototypes-SKACA算法.该算法首先通过聚类算法K-Prototypes将整个微数据集划分成几个较大的簇,然后再采用S-KACA算法对这些簇的微数据进行匿名化处理.实验验证K-Prototypes-S-KACA算法在隐私保护程度和数据可用性的大小与S-KACA算法相近,但是算法运行效率却得到了很大的提高.  相似文献   

13.
智能网联汽车的高维轨迹数据被广泛用于从车辆的行驶轨迹中发现不同运动模式,从而降低交通风险、提高通行效率. 然而,数据利用过程中的隐私问题日益受到关注,如何在隐私保护的前提下进行算法的研究和应用是当前面临的一大挑战. 针对车辆轨迹数据分散在不同持有方且出于隐私保护无法共享数据的背景,利用差分隐私联邦学习框架来构建序列自编码网络提取轨迹序列的低维表示,并进一步利用轨迹的低维空间向量来发现不同时段下车辆的频繁路线. 提出的框架既通过本地训练避免了用户隐私数据的分享,又能通过高斯差分隐私机制防止模型信息的泄露. 该框架在真实的轨迹数据集上进行了验证,利用LSTM自编码作为嵌入学习网络,与非联邦、非差分加密的模型进行了对比分析,最后对三种得到的轨迹嵌入通过聚类分析发现该框架下学习的模型在充分尊重了隐私保护的前提下,仍然能够找出有效的频繁轨迹.  相似文献   

14.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.  相似文献   

15.
针对传统的基于欧几里得距离函数计算轨迹相似性过程,要求轨迹等长且时间点对应,没有考虑轨迹的形状,一定程度影响了轨迹隐私保护的效果和数据的利用率问题,提出了一种基于Fréchet距离函数的轨迹隐私保护方法.该方法将轨迹运动方向相近且平均速度相近的轨迹匿名在一起,利用Fréchet距离方法计算轨迹间的距离,最后利用轨迹图之间的权值实现轨迹匿名集合.与其他隐私保护算法比较,在隐私保护和信息损失率上都有一定的改进,表明该方法在处理隐私保护数据方面是有效的.  相似文献   

16.
针对传统的基于欧几里得距离函数计算轨迹相似性过程,要求轨迹等长且时间点对应,没有考虑轨迹的形状,一定程度影响了轨迹隐私保护的效果和数据的利用率问题,提出了一种基于Fréchet距离函数的轨迹隐私保护方法.该方法将轨迹运动方向相近且平均速度相近的轨迹匿名在一起,利用Fréchet距离方法计算轨迹间的距离,最后利用轨迹图之间的权值实现轨迹匿名集合.与其他隐私保护算法比较,在隐私保护和信息损失率上都有一定的改进,表明该方法在处理隐私保护数据方面是有效的.  相似文献   

17.
针对现有数据扰动方法难以维持原始数据的聚类可用性问题,提出了一种隐私保护数据扰动算法DPTPE.基于邻域拓扑势熵将节点划分为不同类型,对于邻域分散型节点,以该节点的k邻域中节点坐标的均值替换其原始坐标;对于邻域紧密型节点,在其安全邻域中随机选择一个节点替换该节点。实验结果表明,DPTPE算法可以保护数据的隐私安全,还能够较好地维持数据集的聚类可用性。  相似文献   

18.
由于权重社交网络的复杂性和噪声随机性,传统的隐私保护方法无法兼顾社交网络中的隐私和效用需求.针对此问题,融合直方图统计和非交互式差分隐私查询模型,提出社交网络边权重直方图统计发布方法.该方法将边权重统计直方图作为查询结果,并设计低敏感度的边权重拉普拉斯噪声随机扰动算法,实现社交关系的差分隐私保护.为减少噪声量,引入社区...  相似文献   

19.
人类移动中的顺序模式在地理社交网络服务的位置推荐中扮演了重要角色。现有的位置推荐系统必须访问用户的原始签到位置数据, 以挖掘其顺序模式, 然而这会泄露用户的位置隐私。针对该问题, 提出一种基于差分隐私保护的位置推荐算法(Differential Privacy Location Recommendation, DPLORE)。首先, 根据原始数据构建转移计数矩阵, 利用拉普拉斯机制向分解后的矩阵元素添加噪声, 使得算法满足差分隐私保护。接着, 在多阶马尔可夫链模型的基础上, 提出自适应权重的n-阶马尔可夫链模型, 利用用户的顺序模式来进行位置推荐。最后的实验表明, 本文设计的算法框架DPLORE的推荐结果准确率和召回率都优于现有的算法, 同时DPLORE在高推荐精度和严格的位置隐私保护之间达成良好的权衡。  相似文献   

20.
基于位置服务的广泛应用使得位置服务中隐私数据信息的保护、挖掘及利用成为大量学者关注的重点.但目前关于用户隐私的保护主要集中在位置隐私保护协议、位置隐私保护算法(如K-匿名)、隐私保护数据分类及数据挖掘等方面,对隐私保护中隐私的度量研究很少.基于此,分析了隐私保护度量中存在的问题,结合现有隐私保护度量的研究工作提出一种新的用户隐私保护度量集对分析方法,讨论了该方法在数据库隐私保护、位置隐私保护和轨迹隐私保护3种不同应用模式下的具体分析过程.建立了隐私度量的体系标准和内容,并将本文提出的隐私度量方法与其他已有方法进行了优劣比较,对各自特性进行了分析.最后,总结了隐私保护度量方法的发展趋势、未来方向及有待解决的问题.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号