K-means ■隐私保护聚类算法 |
| |
引用本文: | 郑剑,冷碧玉.K-means ■隐私保护聚类算法[J].计算机工程与设计,2022,43(1):26-33. |
| |
作者姓名: | 郑剑 冷碧玉 |
| |
作者单位: | 江西理工大学 信息工程学院,江西 赣州 341000 |
| |
基金项目: | 国家自然科学基金项目(61462034);江西省教育厅科学技术研究基金项目(GJJ170517)。 |
| |
摘 要: | 针对异常离群点对k-means ■算法的聚类精确度影响较大且在确定中心点过程中会泄露聚类数据隐私的问题,提出DPk-means ■算法。标记离群点,降低离群点对k-means ■算法聚类精确度的影响,将差分隐私应用于k-means ■聚类算法中保护聚类数据隐私。在选择聚类初始中心点和迭代求取均值中心点的过程中,应用拉普拉斯机制注入噪声,解决数据隐私泄露的问题。通过隐私预算动态变化对聚类结果准确性的影响及同类算法对比实验分析验证,DPk-means ■算法能够提供更高的隐私保护水平且保证聚类结果的准确性。
|
关 键 词: | 聚类精确度 并行化k均值 离群点 拉普拉斯机制 差分隐私 |
本文献已被 维普 万方数据 等数据库收录! |
|