首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 86 毫秒
1.
聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。  相似文献   

2.
聚类分析在机器学习、数据挖掘、生物DNA信息等方面都起着极为关键的作用。聚类算法从方法学上可分为扁平聚类和层谱聚类。扁平聚类通常将数据集分为K个并行社区,社区之间没有交集,但现实世界的社区之间多具有不同层次之间的包含关系,因而层谱聚类算法能对数据进行更精细的分析,提供更好的可解释性。而相比扁平聚类,层谱聚类研究进展缓慢。针对层谱聚类面临的问题,从对代价函数的选择、聚类结果衡量指标、聚类算法性能等方面入手,调研了大量的相关文献。其中聚类结果衡量指标主要有模块度、Jaccard指数、标准化互信息、树状图纯度等。扁平聚类算法中比较经典的算法有K-means算法、标签传播算法、DBSCAN算法、谱聚类算法等。层谱聚类算法可以进一步划分为分裂聚类算法和凝聚聚类算法,分裂层谱聚类算法有二分K-means算法和递归稀疏割算法,凝聚层谱聚类算法有经典的Louvain算法、BIRCH算法和近年来提出的HLP算法、PERCH算法及GRINCH算法。最后,进一步分析了这些算法的优缺点,并总结全文。  相似文献   

3.
文本聚类技术的有效性验证   总被引:3,自引:0,他引:3       下载免费PDF全文
讨论了利用分类测试集进行聚类量化评价的标准。在此基础上选择k-Means聚类算法、STC(后缀树聚类)算法和基于Ant的聚类算法进行了实验对比。实验表明,STC聚类算法在处理文本时充分考虑了文本的特性,其聚类效果较好;基于Ant的聚类算法在聚类的划分时效果受参数输入的影响较大,其聚类结果与STC相比并不具有优势;在Ant聚类算法中引入文本特性后,可以提高文本聚类的效果。  相似文献   

4.
王宇 《计算机工程与设计》2004,25(11):1884-1885,1896
在分析K-means聚类算法和K-medians聚类算法的基础上,使用Tschebyshev距离(∞-范教)对数据对象集进行聚类分析,得到聚类中心恰为数据对象集的最大值与最小值的均值这一新颖结果,并进而提出了一个新的聚类算法,即K-maxmins聚类算法。给出了K-maxrnins聚类算法与传统K-means聚类算法和K-medians聚类算法的结果比较。  相似文献   

5.
章永来  周耀鉴 《计算机应用》2019,39(7):1869-1882
大数据时代,聚类这种无监督学习算法的地位尤为突出。近年来,对聚类算法的研究取得了长足的进步。首先,总结了聚类分析的全过程、相似性度量、聚类算法的新分类及其结果的评价等内容,将聚类算法重新划分为大数据聚类与小数据聚类两个大类,并特别对大数据聚类作了较为系统的分析与总结。此外,概述并分析了各类聚类算法的研究进展及其应用概况,并结合研究课题讨论了算法的发展趋势。  相似文献   

6.
李志华  王士同 《计算机工程》2007,33(23):189-190
介绍了量子势能、量子力学中粒子的分布机制和量子聚类算法,给出了量子聚类QC算法的物理理论根据,指出了量子聚类算法的优点和不足,提出了一种基于度量距离改变的量子聚类算法DQC,该算法对IRIS样本的聚类准确率比QC算法高出了8个百分点,实验结果证明了该算法的有效性。  相似文献   

7.
一种基于蚁群算法的模糊C均值聚类   总被引:22,自引:0,他引:22  
周新华  黄道 《控制工程》2005,12(2):132-134
针对模糊C均值(FCM)聚类算法,在选取聚类中心点时采用随机选取易使得迭代过程陷入局部最优解,FCM算法自身并不能确定聚类个数需要人为设定,并在数据分类应用时具有了一定误差的问题,提出了一种基于蚁群算法的FCM聚类算法。该算法根据蚁群聚类算法确定模糊聚类个数和FCM算法的初始聚类中心:利用蚁群算法的全局搜索性、并行计算性等特点避免了聚类陷入局部最优解:仿真结果表明了该算法的有效性。  相似文献   

8.
一种基于密度树的网格快速聚类算法的研究   总被引:3,自引:0,他引:3  
聚类算法是数据挖掘领域中一个非常重要的研究方向。人们已经提出了许多适用于大规模的、高维的数据库的聚类算法。基于密度的聚类算法是其中一个比较典型的研究方向。该文以CABDET算法为基础,提出了一种基于密度树的网格快速聚类算法,该算法将网格的原理运用到基于密度树的聚类算法中,有效地提高了聚类的效率,降低了I/O的开销。  相似文献   

9.
改进的k-平均聚类算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
孙士保  秦克云 《计算机工程》2007,33(13):200-201
聚类算法的好坏直接影响聚类的效果。该文讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种基于加权改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果。  相似文献   

10.
一种有效聚类算法的研究和实现   总被引:1,自引:0,他引:1  
张永梅  韩焱  张建华 《计算机应用》2005,25(7):1573-1576
提出了一个基于数学形态学的三维空间聚类算法。该算法通过闭合运算,将空间对象聚成类,一次完成三维空间聚类,可以快速处理非凸的、复杂的聚类形状。由于该算法基于数学形态学,所以易于实现其高性能并行算法。采用实例将算法与普通聚类算法进行了性能比较。  相似文献   

11.
利用成簇算法延长无线传感器网络的生命周期是一个研究热点。LEACH就是一种基于簇的协议。提出一种改进方案,成簇过程考虑传感器节点剩余能量和簇头与非簇头节点之间的距离,并增加了自我维护和局部成簇的特性,有效地提高了生命周期。  相似文献   

12.
利用成簇算法延长无线传感器网络的生命周期是一个研究热点.LEACH就是一种基于簇的协议.提出一种改进方案,成簇过程考虑传感器节点剩余能量和簇头与非簇头节点之间的距离,并增加了自我维护和局部成簇的特性,有效地提高了生命周期.  相似文献   

13.
最大连通度生成簇算法建立的簇之间存在重叠度较高的现象,没有考虑网络能量均衡,对网络寿命会产生不良影响。提出了基于最大连通度的自维护分簇算法,它是最大连通度生成簇算法的推广,达到降低簇之间的重叠度,延长网络寿命的目的。仿真结果验证了算法的有效性。  相似文献   

14.
针对无线传感器网络最大连通度生成簇算法建立的簇之间存在重叠度较高的现象,且没有考虑网络能量均衡对网络寿命会产生不良影响的问题,提出了基于聚合度的自维护分簇算法.算法综合节点的聚合度和节点能量选取簇头,并通过簇头节点的迁移来降低网络簇结构的重叠性,同时综合聚合度、能量和相似度选取替补簇头,实现网络的自维护.算法达到降低簇之间的重叠度,均衡网络能量,延长网络寿命的目的.仿真结果验证了算法的有效性.  相似文献   

15.
In designing wireless sensor networks of image transmitting, it is important to reduce energy dissipation and prolong network lifetime. This paper presents the research on existing clustering algorithm applied in heterogeneous sensor networks and then puts forward an energy-efficient prediction clustering algorithm, which is adaptive to sensor networks with energy and objects heterogeneous. This algorithm enables the nodes to select the cluster head according to factors such as energy and communication cost, thus the nodes with higher residual energy have higher probability to become a cluster head than those with lower residual energy, so that the network energy can be dissipated uniformly. In order to reduce energy consumption when broadcasting in clustering phase and prolong network lifetime, an energy consumption prediction model is established for regular data acquisition nodes. Simulation results and the application in image clustering show that compared with current clustering algorithms, this algorithm can achieve longer sensor network lifetime, higher energy efficiency, and superior network monitoring quality.  相似文献   

16.
分簇算法是一种延长无线传感网络生命期的重要技术,本文提出了一种新的基于分布式能量估计的分簇算法,它可以针对能量异构传感器网络的不同场景而应用,更有效地利用能量。仿真结果表明,这种新的分簇算法能够有效地延长网络生命期,并提高网络的数据吞吐量。  相似文献   

17.
LEACH-EE——基于LEACH协议的高效聚类路由算法   总被引:12,自引:0,他引:12  
李岩  张曦煌  李彦中 《计算机应用》2007,27(5):1103-1105
为延缓传感器网络寿命,减少能量的消耗,提出一种基于LEACH协议的高效聚类路由算法(LEACH-EE)。它通过簇头来收集数据,然后簇头之间形成一个多跳的通向基站的最优路径,最后数据融合给一个簇头传给基站。这样解决了LEACH协议的簇头节点负载过重的问题,以及改善了网络能量的消耗和网络的生存时间。实验证明此方法行之有效。  相似文献   

18.
传感器网络由大量能量有限的微型传感器节点组成,如何延长网络的寿命是一个需要解决的重要问题。针对矩形传感器网络,提出一种基于分层的非均衡分簇算法,通过分析节点的能耗来计算层的宽度。仿真实验表明,基于分层的非均衡分簇算法能有效延长网络的寿命。  相似文献   

19.
薛小龙  雷磊  许宗泽 《计算机工程》2010,36(13):111-113
为研究无线传感器网络中的分簇算法性能,在基于TinyOS操作系统的硬件平台上实现混合能量高效分布式分簇(HEED)算法。针对分簇后形成的树状网络拓扑给出相应路由协议和MAC协议。实验结果表明,当网络节点分布均匀时,HEED算法能形成较好的网络拓扑,当网络节点分布不均匀时,性能明显下降,给出的路由协议和MAC协议能保证节点达到较低的能量占空比,从而延长网络生存周期。  相似文献   

20.
刘唐  汪小芬  杨进 《计算机科学》2012,39(8):119-121,125
延长网络寿命并获得更好的监控质量是无线传感器网络成簇算法的重要性能指标。在分析现有主要成簇算法的基础上,提出了一种适应于多级能量异构传感器网络的基于相对距离的成簇算法RDCA(Relative Distance Clus-tering Algorithm)。算法中,节点根据通信范围内其他节点与自身的平均距离、节点自身与基站的距离以及节点当前剩余能量来确定节点成为簇头的概率。所有节点轮流成为簇头,以分摊能量消耗。仿真实验结果表明,与现有主要聚簇算法相比,在多级能量异构环境下,新的成簇算法拥有更长的生存时间和更优的网络监测质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号