一种考虑属性权重的隐私保护数据发布方法 |
| |
引用本文: | 徐 勇, 秦小麟, 杨一涛, 杨种学, 黄 灿. 一种考虑属性权重的隐私保护数据发布方法[J]. 计算机研究与发展, 2012, 49(5): 913-924. |
| |
作者姓名: | 徐勇 秦小麟 杨一涛 杨种学 黄灿 |
| |
作者单位: | 1(南京航空航天大学信息科学与技术学院 南京 210016) 2(安徽财经大学计算机科学与技术系 安徽蚌埠 233030) (uxyong@nuaa.edu.cn) |
| |
基金项目: | 国家自然科学基金项目,国家"八六三"高技术研究发展计划基金项目,高等学校博士学科点专项科研基金项目,江苏省科技支撑计划基金项目,安徽高校省级自然科学研究重大项目 |
| |
摘 要: | k-匿名模型是数据发布领域用于对原始待发布数据集进行匿名处理以阻止链接攻击的有效方法之一,但已有的k-匿名及其改进模型没有考虑不同应用领域对匿名发布表数据质量需求不同的问题.在特定应用领域不同准码属性对基于匿名发布表的数据分析任务效用的贡献程度是不同的,若没有根据发布表用途的差异区别处理各准码属性的泛化过程,将会导致泛化后匿名发布表数据效用较差、无法满足具体数据分析任务的需要.在分析不同应用领域数据分析任务特点的基础上,首先通过修正基本ODP目录系统建立适用于特定问题领域的概念泛化结构;然后在泛化过程中为不同准码属性的泛化路径设置权重以反映具体数据分析任务对各准码属性的不同要求;最后设计一种考虑属性权重的数据匿名发布算法WAK(QI weight-aware k-anonymity),这是一种灵活地保持匿名发布表数据效用的隐私保护问题解决方案.示例分析和实验结果表明,利用该方案求解的泛化匿名发布表在达到指定隐私保护目标的同时,能够保持较高的数据效用,满足具体应用领域特定数据分析任务对数据质量的要求.
|
关 键 词: | 数据发布 隐私保护 权重 k-匿名 泛化 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《计算机研究与发展》浏览原始摘要信息 |
|
点击此处可从《计算机研究与发展》下载免费的PDF全文 |
|