首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 998 毫秒
1.
为解决现有的分布式聚类算法效率低下和不能保护数据隐私的问题,在K-Dmeans算法的基础上,提出一种新的分布式聚类算法.该算法利用数据对象间的密度函数值来优化站点初始聚类中心,从而大大降低了聚类的迭代次数;同时各从站点只需向主站点传送其聚簇的特征信息,有效降低分布式聚类过程中的通信量,保护了各个站点的独立性,实验结果表...  相似文献   

2.
针对无线网络通信数据聚合过程中存在的信息安全问题,提出一种基于区块链技术的无线网络通信数据聚合隐私保护算法.应用隐私同态技术对无线网络通信数据进行初步聚合及加密处理,并应用区块链技术对聚类数据在分布式节点中的传播特性制定相关制约关系,完成数据传输的去中心化,从而实现对无线网络通信数据的隐私保护.实验测试结果验证了算法的...  相似文献   

3.
KACA是一种基于局域泛化的K-匿名化方法.基于该算法,结合敏感属性隐私保护度,提出了一种S-KACA算法.该算法能够更有针对性地保护敏感隐私属性,而且使发布后数据的可用性较高,但由于其在保护敏感隐私信息时设置了一个隐私保护度的参数,会影响算法执行效率,使大规模的数据集应用有一定的局限性.为解决这个问题,引入一个高效的聚类算法——K-Prototypes算法,并将其与S-KACA算法相结合,提出一种K-Prototypes-SKACA算法.该算法首先通过聚类算法K-Prototypes将整个微数据集划分成几个较大的簇,然后再采用S-KACA算法对这些簇的微数据进行匿名化处理.实验验证K-Prototypes-S-KACA算法在隐私保护程度和数据可用性的大小与S-KACA算法相近,但是算法运行效率却得到了很大的提高.  相似文献   

4.
聚类挖掘可以高效准确地从数据中找出很多潜在的、有价值的规律,但也同时存在着泄露用户隐私数据的安全威胁.已经有一些专门针对聚类挖掘的隐私保护研究,其中乘法扰动方法是一种准确性和安全性都较高的隐私保护算法.研究发现已知信息独立分量分析极大地降低了已有乘法扰动方法的安全性,它能够从乘法扰动数据中近似估计隐私数据.为了解决以上问题,提出了局部旋转扰动隐私保护算法,通过准确性分析得出新算法具有零损失准确性.利用安全性分析证明新算法能够有效抵御独立分量分析的攻击,具有更高的安全性.将新算法应用到聚类挖掘中,得到了与未加隐私保护的聚类挖掘非常接近的结果,说明了它的可行性.局部旋转扰动方法的出现,有效地解决了已有乘法扰动方法的安全漏洞,使得聚类挖掘能够更加安全地得到应用.  相似文献   

5.
针对数据挖掘过程中隐私保护问题,本文提出一种面向聚类挖掘的个性化隐私保护算法。该算法界定了隐私度概念及其编码表示,并构造了由原始数据和隐私度共同描述的隐私数据模型。同时对隐私数据进行拓扑分类以获得隐私数据敏感性的线序集。该算法在原始数据、隐私度、元组敏感度、隐私线序集等视图上进行多视图聚类,结合可变k-匿名策略提出面向多视图聚类的满足个性化需求的隐私保护算法,以对不同聚类簇以及同簇内部元组施加程度有别的个性化保护操作。该算法在一定程度上降低了隐私数据在聚类挖掘过程中泄漏的风险。实验结果表明该算法具有较低的信息损失和较好的运行效率,实验验证了所提算法的可行性。  相似文献   

6.
为提高差分隐私保护下推荐算法的准确性,提出了一种考虑差分隐私保护的基于Bhattacharyya系数(BC)的聚类推荐算法.以BC作为项目相似性度量的标准,根据BC相似性对项目进行K-medoids聚类,并在聚类簇中进行私有项目邻居选择.最后,根据最近邻居集信息,对用户的评分进行预测和Top-n推荐.提出的方案有效地克服了已有方法中存在的相似性度量依赖于共同评分的问题,提高了相似性度量的准确性,有效避免了因隐私保护而造成的最近邻居集质量下降的问题.理论分析和实验测试的结果表明,该方法在实现隐私保护的同时还能有效保证推荐的高质量,较好地实现了隐私保护和数据效用之间的平衡,具有良好的应用潜力.  相似文献   

7.
通过设计一种随机数值片拆分统计机制,提出分布式环境下的匿名均值统计和匿名方差统计方法;结合同态加密机制,设计了分布式环境下的随机数据交换方法,实现了分布式环境中匿名数据交换机制.结合上述两种方法,提出分布式环境下基于数据扰乱技术的隐私保护方法,支持高效的分布式隐私保护数据挖掘.共谋攻击的实验结果和分析表明:匿名数据交换机制下的数据挖掘隐私保护方法在高密度共谋攻击的半诚实环境中有较好的鲁棒性,与主流的安全多方计算相比具有显著的效率优势;同时,该方法具有较高的灵活性和通用性,能应用于关联规则挖掘、聚类多种场合.  相似文献   

8.
查询日志的发布会泄露用户的隐私。提出一种基于差分隐私的查询日志匿名化算法:首先构建用户查询项模型进行相似度计算并利用所求结果对用户查询项模型进行聚类,其次在聚类过程中添加指数噪音来满足差分隐私,最后发布匿名化数据。实验表明:该算法有效地提高了查询日志的实用性和隐私保护程度。  相似文献   

9.
针对现有数据扰动方法难以维持原始数据的聚类可用性问题,提出了一种隐私保护数据扰动算法DPTPE.基于邻域拓扑势熵将节点划分为不同类型,对于邻域分散型节点,以该节点的k邻域中节点坐标的均值替换其原始坐标;对于邻域紧密型节点,在其安全邻域中随机选择一个节点替换该节点。实验结果表明,DPTPE算法可以保护数据的隐私安全,还能够较好地维持数据集的聚类可用性。  相似文献   

10.
随着差分隐私研究及其应用的不断拓展,其在轨迹数据发布的隐私保护领域应用受到了广泛关注,现有研究方法大多采用Kmeans聚类方法对轨迹进行聚类划分,但由于差分隐私约束下的轨迹数据集受到噪声的扰动,导致现有的聚类方法无法保证最后的收敛效果。本文提出了一种基于方向控制的差分隐私保护轨迹数据发布方法。首先,提出了基于SKmeans||聚类的轨迹泛化算法,在聚类迭代过程中针对质心的更新,加入方向控制机制,设计指数机制中的打分函数控制质心的收敛,保证高维数据聚类的质量。其次,设计了一个基于有界阶梯噪声机制的轨迹数据发布算法,其中的有界阶梯噪声机制保证了在隐藏轨迹点真实计数的同时,提高了发布后轨迹数据的可用性。最后,通过实验验证了本文所提出方法的有效性。  相似文献   

11.
对基于分形维数的聚类融合算法进行了研究。首先介绍分形维数聚类算法,产生聚类成员;然后利用投票法进行聚类融合;最后简单介绍了云计算环境下分布式聚类融合思想。基于分形维数的聚类融合算法比单一分形维数聚类算法得到的聚类结果更好,具有更好的鲁棒性。在分形维数聚类算法中,结合网格聚类与单一分形聚类的优点,提出了基于网格和分形维数的聚类算法,它可以发现任意形状且距离非邻近的聚类,适合于海量﹑高维数据。  相似文献   

12.
提出一种基于分布式哈希表(DHT)的分布式子空间聚类(DISCLUS)算法,该算法对各结点存储的数据分别进行子空间聚类,对聚类结果进行合并,得到分布式系统的聚类结果.针对子空间聚类的特点,提出结果集缩减和结果集剪枝策略对结点间通讯进行优化.为实现结点聚类结果合并,提出分布式表决算法(DDV).该算法利用底层覆盖网的拓扑结构进行层次化表决信息收集,在动态网络环境中实现了对所有结点的无冗余覆盖.理论分析和实验表明,DISCLUS算法的聚类误差和通讯性能能够较好地适应系统数据集规模、网络规模和数据空间维度的增加.  相似文献   

13.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性.  相似文献   

14.
针对日益严峻的大数据处理时间长、执行速率低等问题,通过深入分析,提出了一种提高大规模数据聚类效率的方法。以K-均值聚类算法为原型,利用Map Reduce模型在大规模数据处理方面的优势,对原有算法进行并行化改进,设计出一种基于Hadoop分布式云平台的K-均值聚类Map Reduce模型。应用此模型,对淘宝用户仿真数据进行聚类试验,试验结果表明,对K-均值聚类算法的Map Reduce模型实现后,性能优于原算法性能,缩短了聚类时间,提高了聚类效率,特别适于对海量数据进行聚类处理。  相似文献   

15.
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动。针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优。首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心。实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类。  相似文献   

16.
1 INTRODUCTION Multi-hop wireless network is an ideal technology to establish an instant communication infrastructure for civilian and military applications. Its applications include collaborative, distributed mobile computing, disaster recovery, law enforcement (crowd control, search and rescue), digital battlefield communications, and so on[1]. Such situations demand a network where all the nodes including the base stations are potentially mobile, and communication must be supported unwi…  相似文献   

17.
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的分布式改进K-means算法,该算法通过引入Canopy算法初始化K-means算法的聚类中心,克服传统K-means算法因初始中心点的不确定性,易陷入局部最优解的问题。本算法在Canopy(罩盖)中完成K-means聚类,并在Canopy间完成簇的合并,聚类效果稳定,迭代次数少。同时,结合MapReduce分布式计算模型,给出改进后算法的并行化设计方法和策略,进一步通过改进相似度度量方法,将该方法用于文本聚类中。实验结果证明该算法具有良好的准确率和扩展性。  相似文献   

18.
作为数据挖掘的一项重要技术,聚类分析具有广泛的应用领域.同时,聚类也是数据挖掘领域中一个相对比较困难的问题.在聚类算法中,基于模糊划分的FCM算法是一种重要的算法.和其它的算法相比,FCM算法具有计算简单、运算速度快,且有比较直观的几何意义的优点,因此在图像处理、模式识别等领域得到了广泛的应用.和所有的c均值算法一样,FCM算法也是只用类中心来表示类,这样只是适合球状类型的簇.本文在目前FCM算法研究的基础上,讨论了传统FCM算法在原型初始化上的局限性.提出一种基于层次凝聚的改进算法,使之能够适用于不规则分布的数据.  相似文献   

19.
在P2PK-Means算法的基础上,提出了一种改进的数据聚类算法DK-Means。该算法不需要所有节点进行全局同步,只需要在直接相连的节点间进行通信,同时利用本地保存的直接相邻节点聚类信息来减少节点间的通信次数,从而减少整个网络的通信开销。与P2PK-Means算法的实验结果对比表明,改进后的算法通信量要小于P2PK-Means算法的通信量,并且在聚类准确度方面也没有损失,此外,随着节点的增多,DK-Means算法所需通信量的增长速度要明显低于P2PK-Means算法。  相似文献   

20.
为有效解决移动Ad Hoc网络簇结构的稳定性问题,提出了一种分簇算法.在流量均衡的基础上, 综合考虑节点所处的网络环境和本身状态,根据适应性权值选择簇首,实现对随机分布的移动节点自适应动态分簇,并通过可用度来优化簇内的节点数.仿真测试表明,该算法在不增加开销的情况下,能适应性均衡簇首负载,有效防止簇首成为瓶颈.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号