最优聚类的k-匿名数据隐私保护机制 |
| |
作者姓名: | 张强 叶阿勇 叶帼华 邓慧娜 陈爱民 |
| |
作者单位: | 福建师范大学计算机与网络空间安全学院 福州 350117;福建省网络安全与密码技术重点实验室(福建师范大学) 福州 350117 |
| |
基金项目: | 国家自然科学基金项目(61972096,61771140,61872088,61872090); |
| |
摘 要: | 基于聚类的k-匿名机制是共享数据脱敏的主要方法,它能有效防范针对隐私信息的背景攻击和链接攻击。然而,现有方案都是通过寻找最优k-等价集来平衡隐私性与可用性.从全局看,k-等价集并不一定是满足k-匿名的最优等价集,隐私机制的可用性最优化问题仍然未得到解决.针对上述问题,提出一种基于最优聚类的k-匿名隐私保护机制.通过建立数据距离与信息损失间的函数关系,将k-匿名机制的最优化问题转化为数据集的最优聚类问题;然后利用贪婪算法和二分机制,寻找满足k-匿名约束条件的最优聚类,从而实现k-匿名模型的可用性最优化;最后给出了问题求解的理论证明和实验分析.实验结果表明该机制能最大程度减少聚类匿名的信息损失,并且在运行时间方面是可行有效的.
|
关 键 词: | 隐私保护 k-匿名 聚类优化 信息损失 数据发布 |
本文献已被 万方数据 等数据库收录! |
|