共查询到19条相似文献,搜索用时 68 毫秒
1.
基于聚类的敏感属性l-多样性匿名化算法 总被引:1,自引:0,他引:1
提出了基于聚类的敏感属性l-多样性匿名化算法,该算法生成的每个聚类至少有l个不同的敏感属性值,每个聚类的大小介于l和2l-1之间,以达到最优划分并提高教据的安全性.同时,该算法生成聚类候选记录集以减少不必要的计算和比较,生成聚类时总是选择与聚类质心信息损失最小的记录,提高了算法效率并减少信息的损失.实验结果表明,该算法是高效的,且生成的匿名数据集具有较高的可用性. 相似文献
2.
3.
面向数值型敏感属性的分级l-多样性模型 总被引:1,自引:0,他引:1
近年来,数据发布隐私保护问题受到了广泛关注,相继提出了多种隐私保护匿名模型.l-多样性模型是其中保护个体隐私的有效方法,但现有的l-多样性模型只适合处理分类型敏感属性,不适合处理数值型敏感属性.为此,提出面向数值型敏感属性的分级l-多样性模型,包括分级相异l-多样性、分级信息熵l-多样性和分级递归(c,l)-多样性.所提出的模型首先将数值型敏感属性域分级,再基于分级信息实现数值型敏感属性的l-多样性.设计了实现这些模型的l-Incognito算法.并且从匿名表的多样性角度进行了比较,实验表明分级l-多样性表比未分级的l-多样性表具有更高的多样度,因此具有更强的抵制同质性攻击和背景知识攻击的能力. 相似文献
4.
针对k-匿名方法无法抵抗同质性攻击和背景知识攻击的问题,提出了实现敏感属性多样性的微聚集算法,该算法把距离类中心最近的敏感属性值不同的l个元组聚为一类,在满足l-多样性的前提下对该类进行扩展。实验结果表明,该算法能够有效地生成满足敏感属性多样性的匿名表。 相似文献
5.
6.
7.
《计算机科学与探索》2018,(5):761-768
随着移动医疗的飞速发展,医疗机构在共享个人医疗数据的同时也存在着隐私泄漏的隐患。基于k-匿名和l-多样性模型,提出利用个性化熵l-多样性隐私保护模型来细粒度地保护用户的隐私,通过区分强弱敏感属性值来提高对敏感属性的约束,降低敏感信息及强信息的泄漏概率,从而达到医疗数据共享安全。通过数据分析及实验结果表明,该方法在提高数据精度的同时可以减少执行时间,而且能提高服务质量,比既有的方案更有效。 相似文献
8.
9.
针对泛化会造成数据信息损失量较大,且这缺陷会随数据维度变大而越明显的问题,提出一种基于局部划分的匿名算法。在确保◢k-匿名和l-多样性的前提下,基于敏感属性栏值约束和记录间距离将数据表横向分成若干个桶,然后对每个桶基于属性间的关联纵向分成多栏,最后对同一桶中各栏中的数据进行随机重排。实验结果表明,在处理高维数据时,与LGAA-CP算法相比,信息损失量减少了47%~183%,关联关系保留率提高了24%~118%。与Slicing算法相比,信息损失量相差在1.5%之内,关联关系保留率提高了8.9%~22.8%。通过分析,该算法在同时确保高维数据的隐私保护能力和数据可用性方面是有效的。 相似文献
10.
11.
数据发布中面向多敏感属性的隐私保护方法 总被引:12,自引:0,他引:12
现有的隐私数据发布技术通常关注单敏感属性数据,直接应用于多敏感属性数据会导致大量隐私信息的泄漏.文中首次对多敏感属性数据发布问题进行详细研究,继承了基于有损连接对隐私数据进行保护的思想,提出了针对多敏感属性隐私数据发布的多维桶分组技术——MSB(Multi-Sensitive Bucketization).为了避免高复杂性的穷举方法,首先提出3种不同的线性时间的贪心算法:最大桶优先算法(MBF)、最大单维容量优先算法(MSDCF)和最大多维容量优先算法(MMDCF).另外,针对实际应用中发布数据的重要性差异,提出加权多维桶分组技术.实际数据集上的大量实验结果表明,所提出的前3种算法的附加信息损失度为0.04,而隐匿率都低于0.06.加权多维桶分组技术对数据拥有者定义的重要信息的可发布性达到70%以上. 相似文献
12.
13.
14.
数据挖掘中的隐私泄漏问题一直备受关注,在确保隐私的前提下达到最佳挖掘效果是近年来数据挖掘领域的研究热点之一。为防止在数据挖掘中发生隐私泄漏等问题,基于隐私保护框架,提出一种支持动态计算冲突度的高效的敏感规则清洗算法。在隐藏敏感规则的同时,动态调整冲突交易的冲突度,以尽量减少对非敏感规则误隐藏的可能性。理论分析与实验结果表明,给出的算法隐藏失败率为零,且大幅度降低了误隐藏率,有效保护了敏感规则,显著改善了算法的清洗效果。 相似文献
15.
当前模糊概念格的直接构造具有指数时间复杂度,且随着真值集合L大小的增加,模糊概念格的规模变得越来越庞大。为此提出了FMBUAD算法,它能够在原有模糊概念格的基础上消去多个消减属性(冗余或者无效属性)得到新的模糊概念格,且不考虑真值集合L的大小。基于模糊概念格的基础理论证明了FMBUAD算法的正确性。该算法首先将所有概念节点内涵中的消减属性隶属度移除;然后找出模糊概念格中所有的删除节点;最后集中处理删除节点父子节点之间的偏序关系。理论证明和实验结果表明:FMBUAD算法构造L-模糊概念格具有较好的时间性能。 相似文献
16.
多维敏感属性隐私保护数据发布方法 总被引:2,自引:0,他引:2
在匿名数据发布中,当敏感属性为多维时,攻击者有可能能够获取一维或几维敏感属性信息,并且结合准标识符信息对其他敏感属性进行推理攻击。针对此问题提出(Dou-l)-匿名模型,更好地保护了敏感信息。基于多维桶和分解思想,提出(Dou-l)-匿名算法,使得即便攻击者掌握了部分敏感数据,仍然能较好地保护其他敏感属性数据的隐私安全性。实际数据实验证明,算法可以较好地均衡发布数据的安全性和可用性。 相似文献
17.
18.
王杨 《计算机与数字工程》2012,40(4):17-18,31
属性约简是知识发现中的关键问题之一。为了有效地获取最小相对约简,该文基于Hu的区分矩阵,即以属性核为起点,通过向属性核不断添加重要程度最大的属性,同时利用属性之间的关联度,使处理数据的范围不断缩小来减少求约简的时间。该算法在计算量减少的同时能得到更简的结果并能得到所有相对约简,实例分析也验证了该算法的有效性。 相似文献