首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 68 毫秒
1.
基于聚类的敏感属性l-多样性匿名化算法   总被引:1,自引:0,他引:1  
提出了基于聚类的敏感属性l-多样性匿名化算法,该算法生成的每个聚类至少有l个不同的敏感属性值,每个聚类的大小介于l和2l-1之间,以达到最优划分并提高教据的安全性.同时,该算法生成聚类候选记录集以减少不必要的计算和比较,生成聚类时总是选择与聚类质心信息损失最小的记录,提高了算法效率并减少信息的损失.实验结果表明,该算法是高效的,且生成的匿名数据集具有较高的可用性.  相似文献   

2.
针对多敏感属性数据中 l-多样性问题及现有隐私保护方法可能导致过高隐匿率的问题,提出一种基于属性分类的多敏感属性隐私保护方法。根据各自敏感属性值的多样性及隐私重要性对属性进行分类,分别设置不同的多样性参数l并进行分组,使之满足各自的多样性要求。实验结果表明,该方法可以有效地保护隐私数据,同时减少数据的隐匿率,提高共享数据的可用性。  相似文献   

3.
面向数值型敏感属性的分级l-多样性模型   总被引:1,自引:0,他引:1  
近年来,数据发布隐私保护问题受到了广泛关注,相继提出了多种隐私保护匿名模型.l-多样性模型是其中保护个体隐私的有效方法,但现有的l-多样性模型只适合处理分类型敏感属性,不适合处理数值型敏感属性.为此,提出面向数值型敏感属性的分级l-多样性模型,包括分级相异l-多样性、分级信息熵l-多样性和分级递归(c,l)-多样性.所提出的模型首先将数值型敏感属性域分级,再基于分级信息实现数值型敏感属性的l-多样性.设计了实现这些模型的l-Incognito算法.并且从匿名表的多样性角度进行了比较,实验表明分级l-多样性表比未分级的l-多样性表具有更高的多样度,因此具有更强的抵制同质性攻击和背景知识攻击的能力.  相似文献   

4.
针对k-匿名方法无法抵抗同质性攻击和背景知识攻击的问题,提出了实现敏感属性多样性的微聚集算法,该算法把距离类中心最近的敏感属性值不同的l个元组聚为一类,在满足l-多样性的前提下对该类进行扩展。实验结果表明,该算法能够有效地生成满足敏感属性多样性的匿名表。  相似文献   

5.
针对多数隐私保护算法不能较好平衡数据精度和数据隐私保护程度的问题,从数据集中准标识属性与敏感属性的关联关系出发,提出一种基于关联规则的匿名算法。运用Aprior算法建立属性间的关联规则,利用互信息量度量其关联度,为准标识属性的分级分类提供依据,同时设置泛化边界与权重,以避免产生较大的匿名成本。实验结果表明,该算法能够减少数据损失,实现数据效用与隐私保护之间的均衡。  相似文献   

6.
为了防止数据敏感属性的泄露,需要对数据敏感属性进行匿名保护。针对l-多样性模型当前已提出的算法大多是建立在概念层次结构的基础上,该方法会导致不必要的信息损失。为此,将基于属性泛化层次距离KACA算法中的距离度量方法与聚类结合,提出了一种基于聚类的数据敏感属性匿名保护算法。该算法按照l-多样性模型的要求对数据集进行聚类。实验结果表明,该算法既能对数据中的敏感属性值进行匿名保护,又能降低信息的损失程度。  相似文献   

7.
随着移动医疗的飞速发展,医疗机构在共享个人医疗数据的同时也存在着隐私泄漏的隐患。基于k-匿名和l-多样性模型,提出利用个性化熵l-多样性隐私保护模型来细粒度地保护用户的隐私,通过区分强弱敏感属性值来提高对敏感属性的约束,降低敏感信息及强信息的泄漏概率,从而达到医疗数据共享安全。通过数据分析及实验结果表明,该方法在提高数据精度的同时可以减少执行时间,而且能提高服务质量,比既有的方案更有效。  相似文献   

8.
差异化多敏感属性Lq-Diversity模型和算法   总被引:1,自引:0,他引:1  
针对多维敏感属性数据发布面临的一般泄露、交叉泄露、相似性泄露、多维独立泄露的威胁,本文提出了敏感属性敏感等级和敏感属性值敏感等级的概念,基于单维l-diversity模型,对各维敏感属性进行单独分组,提出了差异化多维敏感属性模型,验证了该模型在面向多敏感属性数据发布的安全性,并根据此模型提出了相应的DMSA算法,通过实验验证,该算法正确可行,且隐匿率和附加信息损失度的值都很低,数据可用性高,具有良好的隐私保护效果.  相似文献   

9.
针对泛化会造成数据信息损失量较大,且这缺陷会随数据维度变大而越明显的问题,提出一种基于局部划分的匿名算法。在确保◢k-匿名和l-多样性的前提下,基于敏感属性栏值约束和记录间距离将数据表横向分成若干个桶,然后对每个桶基于属性间的关联纵向分成多栏,最后对同一桶中各栏中的数据进行随机重排。实验结果表明,在处理高维数据时,与LGAA-CP算法相比,信息损失量减少了47%~183%,关联关系保留率提高了24%~118%。与Slicing算法相比,信息损失量相差在1.5%之内,关联关系保留率提高了8.9%~22.8%。通过分析,该算法在同时确保高维数据的隐私保护能力和数据可用性方面是有效的。  相似文献   

10.
数据发布中面向多敏感属性的隐私保护技术*   总被引:1,自引:0,他引:1  
针对多敏感属性数据发布中存在的隐私泄露问题,在分析多维桶分组技术的基础上,继承了基于有损连接对隐私数据进行保护的思想,提出了一种(g,l)-分组方法,首先对多敏感属性根据各自的敏感度进行分组,然后将分组数作为多维桶的各个维的维数。同时还给出了2种不同的线性时间的分组算法:一般(g,l)-分组算法(GGLG)和最大敏感度优先算法(MSF)。实际数据集上的大量实验结果表明,该方法可以明显地减少隐私泄露,增强数据发布的安全性。  相似文献   

11.
数据发布中面向多敏感属性的隐私保护方法   总被引:12,自引:0,他引:12  
现有的隐私数据发布技术通常关注单敏感属性数据,直接应用于多敏感属性数据会导致大量隐私信息的泄漏.文中首次对多敏感属性数据发布问题进行详细研究,继承了基于有损连接对隐私数据进行保护的思想,提出了针对多敏感属性隐私数据发布的多维桶分组技术——MSB(Multi-Sensitive Bucketization).为了避免高复杂性的穷举方法,首先提出3种不同的线性时间的贪心算法:最大桶优先算法(MBF)、最大单维容量优先算法(MSDCF)和最大多维容量优先算法(MMDCF).另外,针对实际应用中发布数据的重要性差异,提出加权多维桶分组技术.实际数据集上的大量实验结果表明,所提出的前3种算法的附加信息损失度为0.04,而隐匿率都低于0.06.加权多维桶分组技术对数据拥有者定义的重要信息的可发布性达到70%以上.  相似文献   

12.
针对属性权重为实数而属性值为区间数的多属性决策问题,提出了一种基于满意度的多属性决策方法。本文借鉴连续有序加权平均算子中的满意度、区间数的可能度和集对分析联系数的相关知识,将区间数满意度和同异反三元联系数满意度引入了决策信息不确定性消除问题,接着利用OWA算子对满意度信息进行集结并对方案进行排序。最后进行对比实验,实验结果表明了该方法的有效性和可行性。  相似文献   

13.
针对多敏感属性数据重发布面临的链接攻击、背景知识攻击的威胁,本文首先提出了敏感属性更新集和同一等价敏感组的概念,然后对常见的数据重发布情况,提出了基于DMSA算法的数据重发布新策略,最后对其新策略进行了具体的实例分析,验证了该策略发布的安全性并得出其隐匿率和附加信息损失度的值都很低,从而验证出匿名发布后的数据可用性较高,且具有良好的隐私保护效果.  相似文献   

14.
数据挖掘中的隐私泄漏问题一直备受关注,在确保隐私的前提下达到最佳挖掘效果是近年来数据挖掘领域的研究热点之一。为防止在数据挖掘中发生隐私泄漏等问题,基于隐私保护框架,提出一种支持动态计算冲突度的高效的敏感规则清洗算法。在隐藏敏感规则的同时,动态调整冲突交易的冲突度,以尽量减少对非敏感规则误隐藏的可能性。理论分析与实验结果表明,给出的算法隐藏失败率为零,且大幅度降低了误隐藏率,有效保护了敏感规则,显著改善了算法的清洗效果。  相似文献   

15.
王黎明  姜琴  张卓 《计算机科学》2016,43(8):216-222
当前模糊概念格的直接构造具有指数时间复杂度,且随着真值集合L大小的增加,模糊概念格的规模变得越来越庞大。为此提出了FMBUAD算法,它能够在原有模糊概念格的基础上消去多个消减属性(冗余或者无效属性)得到新的模糊概念格,且不考虑真值集合L的大小。基于模糊概念格的基础理论证明了FMBUAD算法的正确性。该算法首先将所有概念节点内涵中的消减属性隶属度移除;然后找出模糊概念格中所有的删除节点;最后集中处理删除节点父子节点之间的偏序关系。理论证明和实验结果表明:FMBUAD算法构造L-模糊概念格具有较好的时间性能。  相似文献   

16.
多维敏感属性隐私保护数据发布方法   总被引:2,自引:0,他引:2  
在匿名数据发布中,当敏感属性为多维时,攻击者有可能能够获取一维或几维敏感属性信息,并且结合准标识符信息对其他敏感属性进行推理攻击。针对此问题提出(Dou-l)-匿名模型,更好地保护了敏感信息。基于多维桶和分解思想,提出(Dou-l)-匿名算法,使得即便攻击者掌握了部分敏感数据,仍然能较好地保护其他敏感属性数据的隐私安全性。实际数据实验证明,算法可以较好地均衡发布数据的安全性和可用性。  相似文献   

17.
面向多敏感属性医疗数据发布的隐私保护技术   总被引:1,自引:0,他引:1  
金华  刘善成  鞠时光 《计算机科学》2011,38(12):171-177
针对目前多敏感属性医疗数据发布问题,在分析多维桶分组技术的基础上,继承了有损连接对隐私数据进行保护的思想,提出了一种基于相同敏感属性集的L-覆盖性聚类分组方法。首先计算每条记录的相同敏感属性集,然后按照聚类的思想将满足L-覆盖性的记录进行分组。同时给出了L-覆盖性聚类分组的实现算法(LCCU)。实际数据集上的大量实验结果表明,该方法可以有效防止隐私泄露,同时增强数据的可用性。  相似文献   

18.
属性约简是知识发现中的关键问题之一。为了有效地获取最小相对约简,该文基于Hu的区分矩阵,即以属性核为起点,通过向属性核不断添加重要程度最大的属性,同时利用属性之间的关联度,使处理数据的范围不断缩小来减少求约简的时间。该算法在计算量减少的同时能得到更简的结果并能得到所有相对约简,实例分析也验证了该算法的有效性。  相似文献   

19.
传统的关联规则挖掘算法不能在同一事务数据库中连续挖掘多个最小支持度的频繁项目集。为此,提出基于多个最小支持度的频繁项目集挖掘算法。运用集合论定义模型库的概念,将事务数据库转化成模型库,通过检索模型库得到频繁项目集,从而降低频繁项目集的挖掘时间。实验结果表明,该算法的挖掘效率高于Apriori算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号