基于Tsallis熵的近似差分隐私K-means算法 |
| |
作者姓名: | 杨舒丹 李男 郑文娟 杜启明 |
| |
作者单位: | 战略支援部队信息工程大学 网络空间安全学院 郑州 中国 450000;数学工程与先进计算国家重点实验室 郑州 中国 450000;32142 部队 保定 中国 071000 |
| |
基金项目: | 本课题得到国家自然科学基金资助项目(No. 62472447)资助。 |
| |
摘 要: | 利用K-means算法对用户信息进行聚类时,存在隐私泄露的风险。差分隐私保护技术可提供严格的隐私保护,但目前大多数满足差分隐私的K-means算法在处理多维数据时,存在随机选择质心和噪声添加不均衡的问题,因而导致聚类结果不理想。为此,本文提出一种基于Tsallis熵的近似差分隐私K-means算法。针对质心选择的随机性问题,提出Tsallis熵对属性赋权的策略来优化对象间的欧氏距离,然后对比各对象到唯一随机初始质心的赋权欧式距离来确定其余初始质心,使算法在减少随机选择初始质心的同时,提高模型准确率;在此基础上,针对噪声添加不均衡的问题,提出一种能够平衡信噪比的隐私预算分配策略,然后对迭代质心加入高斯扰动,使算法在不增加计算复杂度的情况下满足(ε,δ)- 差分隐私保护,同时提升扰动结果的准确性;最后在四个真实数据集上对算法进行有效性评价。实验结果表明,所提出的算法能够在保证用户隐私安全的同时实现高效用的聚类。
|
关 键 词: | 近似差分隐私|高斯机制|Tsallis熵|K-means聚类|数据挖掘 |
收稿时间: | 2022/1/1 0:00:00 |
修稿时间: | 2022/3/8 0:00:00 |
An approximate differential privacy K-means algorithm based on Tsallis entropy |
| |
Authors: | YANG Shudan LI Nan ZHENG WenJuan DU Qiming |
| |
Affiliation: | Department of Cyberspace Security Academy, Strategic Support Force Information Engineering University, Zhengzhou 450000, China;State Key Laboratory of Mathematical Engineering and Advanced Computing, Zhengzhou 450000, China;People''s Liberation Army 32142 Unit, Baoding 071000, China |
| |
Abstract: | |
| |
Keywords: | approximate differential privacy|Gaussian mechanism|Tsallis entropy|K-means clustering|data mining |
|
| 点击此处可从《》浏览原始摘要信息 |
|
点击此处可从《》下载全文 |
|