首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
一种改进的小生境遗传聚类算法   总被引:2,自引:2,他引:0  
传统的遗传算法具有早熟收敛和后期收敛速度慢的缺点,采用改进的小生境技术解决这一问题,同时根据具体问题改进了遗传算子,并将改进后的小生境遗传算法应用于聚类挖掘中。由于聚类挖掘算法中的K—means算法对初始值K的选取敏感,选取值的不同会导致聚类结果的不同,很容易陷入局部最优,使得聚类结果很差。因此,将改进的小生境遗传算法和K-means算法相结合,得出一种改进的小生境遗传聚类算法。验证表明优该算法对提高聚类分析质量是有效的。  相似文献   

2.
针对经典K-means聚类算法存在易陷入局部最优解的缺点,提出并实现了一种基于Hadoop的改进型遗传聚类算法.该算法利用遗传算法具有全局性和并行性的特点去处理K-means聚类算法易陷入局部最优的缺点,在此基础上对遗传算法进行改进,然后将改进后的遗传算法与K-means算法相结合,为提高算法执行效率,将其基于Hado...  相似文献   

3.
针对数据挖掘因数据集合庞大而不易开展,本文提出了一种采用K-means算法进行聚类、遗传聚类算法确定聚类中心的改进方法。实例结果表明,改进的混合遗传聚类算法有效可行。  相似文献   

4.
王娟 《微型机与应用》2011,30(20):71-73,76
传统K-means算法对初始聚类中心的选取和样本的输入顺序非常敏感,容易陷入局部最优。针对上述问题,提出了一种基于遗传算法的K-means聚类算法GKA,将K-means算法的局部寻优能力与遗传算法的全局寻优能力相结合,通过多次选择、交叉、变异的遗传操作,最终得到最优的聚类数和初始质心集,克服了传统K-means算法的局部性和对初始聚类中心的敏感性。  相似文献   

5.
一种改进的遗传聚类算法   总被引:5,自引:0,他引:5       下载免费PDF全文
给出了一种改进的基于遗传算法的聚类方法。传统的K-means算法局部搜索能力强,但是对初始化比较敏感,容易陷入局部最优值。基本的基于遗传算法的聚类算法是一种全局优化算法,但是其局部搜索能力较差,收敛速度慢。针对这两个方法所存在的问题,提出了一种改进的聚类算法。该方法结合了两个方法的优点,引入了K-means操作,再用遗传算法进行优化,并且在该方法中改进了遗传算法中的交叉算子,大大提高了基于遗传算法的聚类算法的局部搜索能力和收敛速度。  相似文献   

6.
7.
一种改进K-means算法的聚类算法CARDBK   总被引:1,自引:0,他引:1  
CARDBK聚类算法与批K-means算法的不同之处在于,每个点不是只归属于一个簇,而是同时影响多个簇的质心值,一个点影响某一个簇的质心值的程度取决于该点与其它离该点更近的簇的质心之间的距离值。 从聚类结果的熵、纯度、F1值、Rand Index和NMI等5个性能指标值来看,与多个不同算法在多个不同数据集上分别聚类相比, 该算法具有较好的聚类结果;与多个不同算法在同一数据集上很多不同的初始化条件下分别聚类相比,该算法具有较好且稳定的聚类结果;该算法在不同大小数据集上聚类时具有线性伸缩性且速度较快。  相似文献   

8.
孙秀娟  刘希玉 《计算机应用》2008,28(12):3244-3247
在K-means算法中,聚类数k是影响聚类质量的关键因素之一。目前,已经提出了许多确定最佳k值的聚类有效性方法,但这些方法都不能很好地处理两种数据集:类(簇)密度不同的数据集和类间距比较小的数据集(含有合并簇的数据集)。为此,提出了一种新的聚类有效性函数,该函数定义为数据特征轴总长度的平方与最小类间距的比值,最佳聚类数为这个比值达到最小时对应的k值。同时,为减小K-means算法对噪声和孤立点数据的敏感性,使用了基于加权的改进K-平均的方法计算类中心。实验证明,与其他算法相比,基于新聚类有效性函数的K-wmeans算法不仅降低了噪声和孤立点数据对聚类结果的影响,而且能有效地处理上面提到的两种数据集,明显提高了数据聚类质量。  相似文献   

9.
针对初始聚类中心对传统K-means算法的聚类结果有较大影响的问题,提出一种依据样本点类内距离动态调整中心点类间距离的初始聚类中心选取方法,由此得到的初始聚类中心点尽可能分散且具代表性,能有效避免K-means算法陷入局部最优。通过UCI数据集上的数据对改进算法进行实验,结果表明改进的算法提高了聚类的准确性。  相似文献   

10.
一种遗传模糊聚类算法及其应用   总被引:2,自引:1,他引:1  
宋娇  葛临东 《计算机应用》2008,28(5):1197-1199
研究一种基于遗传算法的模糊聚类方法,即将遗传算法得到的聚类中心作为模糊C-均值(FCM)聚类算法初值,这样既可以克服FCM算法对初始中心敏感的缺点,也可以解决遗传算法只能找到近似解的问题。将算法用于通信信号的星座聚类,根据聚类有效性函数自适应地确定聚类中心,并完成信号类型的识别。仿真实验证明,当存在较小的定时误差时,算法对PSK和QAM信号仍然是有效的。  相似文献   

11.
层次聚类算法的改进及分析   总被引:2,自引:0,他引:2  
层次凝聚算法是一个非常有用的聚类算法,它在迭代地凝聚每次接近对直到所有的数据都属于同一个簇.但层次聚类也存在着几个缺点,如聚类时的时空复杂性高;聚类的簇效率低、误差较大等.经验研究表明,大部分HAC算法都有这样一个趋势:除了在谱系图的顶层,所有低层聚类的簇都是比较小的并且很接近于其他的簇,提出了一种改进算法能够减小时空复杂性并能验证其正确性,分析与实验都证明这种方法是非常有效的.  相似文献   

12.
为了提高图像压缩的效率,在分析研究SPIHT(Set Partitioning in Hierarchical Trees)原理的基础上,对其进行了改进,即首先进行移位预处理,减少编码位以提升压缩率.实验验证表明,SPIHT改进算法不仅可大大的减少复杂度与减少占用内存量,而且在实用性上可进一步提高,并且易于硬件的实现.  相似文献   

13.
核模糊聚类算法不适用于含孤立点与噪声点的数据,并且对初始化中心敏感。针对此种情况,结合减法聚类,对样本加权,放宽隶属度归一化条件,提出基于减法聚类的加权核模糊聚类。通过IRIS和WINE数据集证实改进算法比传统的核聚类算法具有更高的健壮性与抗噪性,并将改进后的算法运用在育肥猪出栏中,验证了算法的实用性与可行性。  相似文献   

14.
改进型遗传算法及其性能分析   总被引:7,自引:1,他引:6  
本文受模拟退火技术的启发引入了一种新的改进型遗传算法,在二进编制编的基础上,研究了交叉位置等概率选取交叉操作的不利影响。在此基础上提出了一种每个基因位叉概率自适应变化的新的交叉操作模拟结果表明,新算法的收敛性能远远高于标准遗传算法。  相似文献   

15.
遗传算法及其应用   总被引:13,自引:1,他引:13  
跹传算法是模拟自然界生物进行过程的计算模型,作为一种有效的全局并地优化搜索工具,它具有简单,通用、鲁棒性强和适于并行分布算处理的特点以及广泛的应用潜力,本文主要阐述了遗传算法的基本原理、方法和特点、并着重从应用的角度对它的主要研究内容(包括并行实现)进行了较深入的讨论。  相似文献   

16.
首先从理论上对三种传统遗传算子的作用进行了定量分析,在此基础上提出了一种新的遗传算子--扩散算子,并利用模拟退火法给出了扩散概率.这种增加扩散算子的遗传算法,较好地克服了传统遗传算法易发生成熟前收敛和收敛速度过慢的缺点,仿真结果表明了其实用性和有效性.  相似文献   

17.
模糊自适应遗传算法及其性能分析   总被引:3,自引:0,他引:3  
遗传算法是应用比较广泛的一种随机优化算法,而交叉和变异是两个关键操作,本文针对遗传算法在应用过程中叉交概率和变异概率所存在的问题提出一种模糊自适应遗传算法,新算法利用模糊系统技术来自适应估计交叉概率和变异概率,最后,通过多峰函数优化问题的仿真结果证明了算法的实用性和有效性。  相似文献   

18.
启发式遗传算法及其应用   总被引:8,自引:0,他引:8  
1.引 言 在科学实践、工程技术和日常生活中,人们常常会遇到大量的、各式各样的最优化问题.最优化方法在近几十年里获得了巨大的发展,但目前很多方法不同程度上还存在着一些不足之处.尤其是最终所求得的大多为局部最优解,并不是全局最优解.而近年来得到蓬勃发展的遗传算法其本质是一种求解问题的高效并行全局搜索方法.它能在搜索过程中自动获取和  相似文献   

19.
应急物流在国计民生中发挥了至关重要的作用,加强应急物流建设的重要性凸显.研究了基于多车场车辆调度模型的应急调度问题.通过聚类分析的启发式算法,将多站点VRP问题转换为单一站点的VRP问题,再针对单一站点进行遗传算法的编码以及选择算子的选取,从而得到最终近似优化解.最后通过实例计算证明了该方法解决MDVRP问题的实用可行性和科学有效性.  相似文献   

20.
针对大规模、高维、稀疏的分类数据聚类,CLOPE算法相比于传统的聚类算法在聚类质量及运行速度上都有很大的提升。然而CLOPE算法存在聚类的质量不稳定、没有区分每维属性对聚类的贡献度、需要预先指定排斥因子r等问题。为此,提出基于随机顺序迭代和属性加权的分类数据聚类算法(RW-CLOPE)。该算法利用"洗牌"模型对原始数据进行随机排序以排除数据输入顺序对聚类质量的影响。同时,根据信息熵计算各个属性的权重,以区别每维属性对聚类的贡献度,极大地提升了数据聚类的质量。最后,在高效的集群平台Spark上,实现了RW-CLOPE算法。在三个真实数据集上的实验结果表明:在数据集乱序后的份数相同时,RW-CLOPE算法比p-CLOPE算法取得更好的聚类质量。对蘑菇数据集,当CLOPE算法取得最优聚类结果时,RW-CLOPE比CLOPE取得高68%的收益值,比p-CLOPE取得高25%的收益值;针对大量数据,基于Spark的RW-CLOPE算法比基于Hadoop的p-CLOPE算法执行时间更短;计算资源充足时,随机顺序的数据集份数越多,执行时间的提升越明显。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号