首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分K均值算法受用户指定的聚类个数的影响的问题。并结合Chameleon算法,合并划分过细簇,优化聚类结果。仿真实验证明改进的聚类算法的抱团性和分离性优于二分K均值聚类算法。  相似文献   

2.
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺陷,定义了簇间相似度度量对传统K-均值聚类进行改进.新算法可以在事先不确定K值的情况下,根据欧氏距离选取初始质心并按照K均值算法聚类,然后过滤噪声样本并确定簇半径,计算簇间相似度并合并相似簇确定数据集的类别数并得到较优的聚类结果.通过在UCI数据集的实验结果表明,新算法能准确确定类别数并有高于传统K均值算法聚类精度.  相似文献   

3.
针对二分K-均值算法由于随机选取初始中心及人为定义聚类数而造成的聚类结果不稳定问题,提出了基于密度和中心指标的Canopy二分K-均值算法SDC_Bisecting K-Means。首先计算样本中数据密度及其邻域半径;然后选出密度最小的数据并结合Canopy算法的思想进行聚类,将得到的簇的个数及其中心作为二分K-均值算法的输入参数;最后在二分K-均值算法的基础上引入指数函数和中心指标对原始样本进行聚类。利用UCI数据集和自建数据集进行模拟实验对比,结果表明SDC_Bisecting K-Means不仅使得聚类结果更精确,同时算法的运行速度更快、稳定性更好。  相似文献   

4.
基于可变染色体长度的遗传K均值聚类算法   总被引:2,自引:2,他引:0  
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进.该算法可以在事先不确定K值的情况下,通过多次的选择、交叉.变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集.通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法.  相似文献   

5.
定义了一个欧氏距离和监督信息相结合的最近邻计算函数,综合考虑无监督学习的空间距离和监督学习的标签数据的影响,从而将K均值算法很好地用于半监督聚类问题;针对K均值算法对初始质心敏感的缺陷,用粒子群算法的搜索空间模拟聚类的欧氏空间,通过迭代搜索找到较优的聚类质心。同时提出动态管理种群的策略以提高粒子群算法搜索效率。新算法在UC I的多个数据集上测试都得到了较好的聚类准确率。  相似文献   

6.
全局K-均值聚类算法需要随机选取初始的聚类中心,本文基于K中心点算法的思想,将其作为全局K-均值聚类算法的初始聚类中心,并对全局K-均值聚类算法进行改进。依托人工模拟数据和学习库中的数据分析,对比两种算法的性能,得出改进算法聚类时间短,鲁棒性强的结论。  相似文献   

7.
针对高分辨率天文图像中的星点聚类研究中存在的 2 个问题:①天文图像的分辨率 较高,且图像处理速度较慢;②选取何种聚类算法对天文图像中的星点进行聚类分析效果较好。 在研究中,问题 1 采用图像分块的方法提高图像的处理速度;问题 2 提出了一种改进的 K 均值聚 类算法,以解决传统的 K 均值聚类算法的聚类结果易受到 k 值和初始聚类中心随机选择影响的问 题。该算法首先在用 K 均值聚类算法对数据初步聚类的基础上确定合适的 k 值,其次用层次聚类 对数据聚类确定初始聚类中心,最后在此基础上再采用 K 均值聚类算法进行聚类。通过 MATLAB 仿真实验的结果表明,该算法的聚类结果与效率优于其他聚类算法。  相似文献   

8.
K 均值聚类算法在银行客户细分中的研究   总被引:1,自引:0,他引:1  
研究银行客户细分问题,对客户进行分类,应针对获利最大的为识别目标.为了减少主观性分析,采用 K 均值聚类算法是数据挖掘技术在银行客户细分中一种重要方法,K 均值算法存在对初始值敏感且容易陷入局部最优值的缺点,导致银户客户分类准确率低.为了提高银行客户细分的准确率,提出了一种基于改进的 K 均值聚类的银行客户细分方法.算法首先通过有效指数法动态调整初始聚类数 K,减轻了聚类结果对初始聚类数 K 的依赖,通过自适应最佳密度半径来确定聚类中心,降低聚类中心对分类结果的影响,加快聚类速度,最后通过初始聚类数 K 和聚类中心对银行客户进行细分.在 C++ 语言平台上,采用某市银业的客户分类数据对算法进行实验,结果表明,算法有效地克服了传统 K 均值算法易陷入局部最优值,提高了客户分类准确率,聚类结果更加合理,为银行决策者提高有效的参考,并带来更多的收益.  相似文献   

9.
为了改善K均值聚类算法对初始聚类中心敏感和易于陷入局部最优的不足,提出人工蜂群算法和K均值聚类算法相结合的想法,即基于人工蜂群优化的K均值聚类算法。通过全局寻优能力强的人工蜂群算法初始化K均值的聚类中心并优化聚类中心的位置,从而帮助K均值跳出局部极值,优化聚类效果。将混合聚类算法用Iris、Red Wine和New Red Wine数据集做聚类测试,结果表明该算法既克服了原始K均值聚类算法容易受初始聚类中心影响和不稳定的缺点,又具有良好的性能和聚类效果。  相似文献   

10.
为避免初始聚类中心陷入局部最优,孤立点影响聚类准确性,结合分裂式思想,提出一种基于密度加权的K均值聚类算法.以K均值聚类算法为基础,引入分裂式思想,提取所有数据对象的属性值组建矢量,通过求解所有数据对象的全部属性,得到经过规范化预处理的数据对象矩阵,根据样本点与点群之间的最小最大距离,构建分裂式K均值聚类算法,采用样本点密度函数界定公式,选取出最优初始聚类中心,结合样本点间距离,完成密度加权下的分裂式K均值聚类算法设计.经对比实验结果发现,所提算法较好地解决了初始聚类中心选取的随机问题,在有效提高聚类准确性的同时大幅度降低了迭代次数,提升了聚类效率.  相似文献   

11.
王娟 《微型机与应用》2011,30(20):71-73,76
传统K-means算法对初始聚类中心的选取和样本的输入顺序非常敏感,容易陷入局部最优。针对上述问题,提出了一种基于遗传算法的K-means聚类算法GKA,将K-means算法的局部寻优能力与遗传算法的全局寻优能力相结合,通过多次选择、交叉、变异的遗传操作,最终得到最优的聚类数和初始质心集,克服了传统K-means算法的局部性和对初始聚类中心的敏感性。  相似文献   

12.
视频镜头聚类是基于内容的视频分析和检索领域中的一个重要问题.提出了一种对视频镜头的半监督聚类算法(SSCA),该算法首先在初始化时对已知的成对实例约束集进行聚类,利用在初始化时生成的簇来指导高维空间中其他视频镜头数据的聚类.由于高维空间中不同的维度存在着不同的相关性,所以为每一个簇引入权重向量.之后提出了一种基于最大距离的聚类中心分割策略,来解决聚类中心的选取问题.最后,考虑到对于聚类个数的选择往往对最终的结果有很大的影响,算法中采用贝叶斯信息准则来评估给定范围的聚类个数.实验结果表明,提出的算法有效地提高了聚类算法的准确性并减少了算法的响应时间.  相似文献   

13.
为改进传统K-means聚类算法中存在因随机选择初始质心而导致聚类结果不稳定且准确度低的缺点,提出基于改进量子旋转门人工鱼群算法的K-means聚类(IQAFSA)算法,通过动态更新量子旋转门的旋转角提高下一代更新方向准确度及更新速度。变异策略从传统的非门改为H门,既增加种群的多样性,又使全局搜索能力增强;最终使用所改进算法选取K-means的初始质心再进行聚类。通过UCI数据的测试以及在医学相关数据上的实验表明,提出的算法具有有效性,准确度较高且收敛速度较快。  相似文献   

14.
为了解决用户在室内定位中,依靠WiFi指纹定位存在精度不高、误差偏大的问题,提出一种基于改进二分K-means聚类算法的室内定位方法。通过层次聚类的思想对二分K-means聚类算法(BKM)进行改进,解决了BKM聚类算法需要提前确定聚类中心、导致指纹定位中聚类结果受初始聚类个数影响的缺陷,并结合变色龙算法(Chameleon),将部分划分过细的簇合并,优化定位指纹库的可靠性。仿真实验结果表明所提出的方法有效降低了计算复杂度,提高了定位精度。此外,该方法与目前常用的BKM聚类算法相比,具有更好的聚类效果和定位精度。  相似文献   

15.
新的K-均值算法最佳聚类数确定方法   总被引:8,自引:0,他引:8       下载免费PDF全文
K-均值聚类算法是以确定的类数k和随机选定的初始聚类中心为前提对数据集进行聚类的。通常聚类数k事先无法确定,随机选定的初始聚类中心容易使聚类结果不稳定。提出了一种新的确定K-均值聚类算法的最佳聚类数方法,通过设定AP算法的参数,将AP算法产生的聚类数作为聚类数搜索范围的上界kmax,并通过选择合适的有效性指标Silhouette指标,以及基于最大最小距离算法思想设定初始聚类中心,分析聚类效果,确定最佳聚类数。仿真实验和分析验证了以上算法方案的可行性。  相似文献   

16.
一种基于大密度区域的模糊聚类算法   总被引:1,自引:0,他引:1  
针对模糊C-均值(FCM)算法对初始聚类中心和噪声数据敏感的缺陷,提出一种基于大密度区域的模糊聚类算法.该算法首先利用大密度区域以及样本的密度值变化方法,选取初始聚类中心以及候选初始聚类中心,并依据初始聚类中心与候选初始聚类中心的距离,确定初始聚类中心点,从而有效的克服了随机给定初始聚类中心容易使算法收敛到局部极小的缺陷;其次,分别利用密度函数为样本加权和引用改进的隶属度函数进行优化,有效地提高了模糊聚类的抗噪性;最后实验验证了算法在初始聚类中心的确定,聚类效果和抗噪性方面具有良好的效果.  相似文献   

17.
一种不需经验参数的视频镜头自校正聚类方法   总被引:5,自引:0,他引:5       下载免费PDF全文
镜头聚类是视频内容分析的重要途径。为能够自动、准确地实现镜头聚类,设计和实现了一种新的镜头聚类方法,这种方法从一个初始分割开始,经多次聚类分裂与合并的迭代,即能自动地进行误差校正,而且这种方法既不需要通过人工交互来解决试探聚类方法的误差调节问题,也不需要在迭代聚类算法中进行难以确定的经验参数和经验阈值的设定。实验证明,该方法能较好地解决镜头的自动、准确聚类问题。  相似文献   

18.
针对大数据环境下并行K-means算法存在的面对高维数据聚类效果差、数据分区不均匀、初始质心敏感等问题,提出了一种基于MapReduce和MSSA的并行K-means算法MR-MSKCA。首先,提出基于肯德尔相关系数和深度稀疏自动编码器的降维策略(dimensionality reduction strategy based on Kendall correlation coefficient and DSAE,DRKCAE)对高维数据进行特征加权和特征提取,解决了高维数据不相关特征和结构稀疏导致的聚类效果差的问题;其次,提出基于两段映射的广义超平面分区策略 (uniform partition strategy based on two-stage mapping,UPS)对数据集进行划分,获取均匀的数据分区;最后提出非均匀变异麻雀搜索算法 (non-uniform mutation sparrow search algorithm,MSSA)用于获取并行K-means的聚类质心,解决了算法初始质心敏感的问题。在UCI数据集上进行的实验显示,MR-MSKCA较MR-KNMF、MR-PGDLSH、MR-GAPKCA的运行时间分别降低了45.1%、49.1%、59.8%,聚类效果分别提升了19.2%、22.8%、24%,表明 MR-MSKCA对大数据进行聚类时有良好性能,适用于不同场景的大数据聚类分析。  相似文献   

19.
模糊C均值(FCM)聚类算法采取随机选取聚类中心的方法,这种方法使得FCM算法在局部范围内容易获得最优解,但在全局范围内效果较差,且FCM算法中聚类簇的个数一般需要人为设定。面对上述种种问题,文中将蚁群聚类算法和FCM聚类算法进行结合,获得了一种改进的FCM聚类算法。该算法在初步聚类中利用蚁群聚类产生聚类中心和簇的个数,将产生的聚类中心提供给FCM算法进行再次聚类。利用蚁群聚类的全局搜索和并行运算的优点避免了聚类易陷入局部最优解的缺陷。经过实验验证,该算法较一般FCM算法具有更好的性能。  相似文献   

20.
基于遗传算法的聚类分析在CT图像分割中的应用   总被引:2,自引:0,他引:2  
针对CT医学图像的特点,本文将遗传算法与聚类分析两种工具相结合,应用到医学CT图像分割中。对K均值聚类做了简要分析和评论,在此基础上将遗传算法引入聚类分析中,利用遗传算法搜索的随机性和并行性,从而克服了K均值聚类的局部性和对初始聚类中心的敏感性;并且可以根据分割的要求,合理地调整聚类时的特征向量和权重。试验结果表明上述方法是可行的,达到了较好的分割效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号