首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
针对传统k均值算法易受初始聚类中心和异常数据的影响等缺陷,利用萤火虫优化算法全局搜索能力强、收敛速度快的优势,对k均值算法的初始聚类中心进行优化,并通过引用一种加权的欧氏距离,减少异常数据等不确定因素带来的不良影响,提出了一种基于萤火虫优化的加权k均值算法。该算法在提升聚类性能的同时,有效增强了算法的收敛速度。在实验阶段,通过UCI数据集中的几组数据对该算法进行了分类实验及有效性测试,实验结果充分表明了该算法的有效性及优越性。  相似文献   

2.
改进的基于遗传算法的粗糙聚类方法   总被引:2,自引:0,他引:2       下载免费PDF全文
传统的聚类算法都是使用硬计算来对数据对象进行划分,然而现实中不同类之间对象通常没有明确的界限。粗糙集理论提供了一种处理边界对象不确定的方法。因此将粗糙理论与k-均值方法相结合。同时,传统的k-均值聚类方法必须事先给定聚类数k,但实际情况下k很难确定;另外虽然传统k-均值算法局部搜索能力强,但容易陷入局部最优。遗传算法能得到全局最优解,但收敛过快。鉴于此,提出了一种改进的基于遗传算法的的粗糙聚类方法。该算法能动态地生成k-均值聚类数,采用最大最小原则生成初始聚类中心,同时结合粗糙集理论的上近似和下近似处理边界对象。最后,用UCI的Iris数据集分别对算法进行实际验证。实验结果表明,该算法具有较高的正确率,综合性能更加稳定。  相似文献   

3.
现有的对多维数据进行聚类的常用聚类算法,通常需要事先给定聚类数k.但在大多数情况下,聚类数k事先无法确定,因此需要对最佳聚类数k进行优化处理.采用基于微粒群算法的聚类算法.为了解决微粒群聚类算法无法确定聚类数k的现象,通过k均值算法的引入,实现最佳聚类数k的求解和聚类有效性函数的构造,试验证明引入类间距离的聚类有效性检测函数对最佳聚类数判别科学,同时由于检测函数中类间距离权重的引入使该检测函数可以更好地应用于现实数据分析.  相似文献   

4.
基于层次聚类的k均值算法研究   总被引:4,自引:3,他引:1  
针对k均值算法需要用户事先确定聚簇数k、阈值t和聚簇中心Q,提出了一种基于层次的k均值聚类算法(HKMA)。该算法首先采用层次方法对文档进行初始聚类,得到的聚类总数作为k均值算法中的k值,在此基础上,通过k均值聚类对聚类结果进行修正。最后通过实验验证了算法的准确度和时间效率,通过与其他聚类算法的比较,所提出的算法具有更好的性能。  相似文献   

5.
基于粒子群优化的高斯核函数聚类算法   总被引:2,自引:1,他引:1  
于进  钱锋 《计算机工程》2010,36(14):22-23
针对视频帧数据在时间轴上的高斯分布特征,提出基于样本和高斯核相似性度量的聚类算法,采用度量方法考虑概率分布密度因素,同时利用改进的粒子群优化算法加速聚类过程。实验结果表明,与基于C均值聚类算法相比,该算法具有较强的全局搜索能力和聚类精度,在视频数据聚类分析中具有更高的效率和更佳的聚类效果。  相似文献   

6.
基于向量内积不等式的分布式k均值聚类算法   总被引:13,自引:2,他引:11  
聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这一问题的有效方法.在已有分布式聚类算法k—DMeans基础上,结合向量内积不等式关系对算法加以优化,提出分布式聚类算法k—DCBIP.理论分析和实验结果表明,算法k—DCBIP优于k-DMeans,可以有效地解决大数据集聚类问题,算法是有效可行的.  相似文献   

7.
基于PSO的可能性C均值聚类算法的研究   总被引:1,自引:0,他引:1  
可能性C均值算法(PCM)是为了克服模糊C均值算法对噪声的敏感性而提出来的,但是它也存在一些缺陷,如易陷入局部最优,对初始条件敏感,导致聚类结果一致性等问题.针对以上问题,通过引进粒子群算法对其进行改进可以有效地避免这些问题,即提出了基于粒子群优化的可能性C均值聚类算法(PSO-PCM).基于粒子群优化的可能性C均值聚类方法首先对编码过的数据点进行优化,然后对该方法产生的中心点进行聚类,在聚类的过程中根据适应度函数再进行调节.通过对给定数据集的聚类测试,结果表明,基于粒子群优化的可能性C均值聚类方法在收敛速度和全局寻优能力等方面有较大的改进.  相似文献   

8.
针对BPNN模型在煤与瓦斯突出预测中存在收敛慢、误差较大等问题,建立了RBFNN模型对煤与瓦斯突出进行预测。采用对样本具有普适性的核k均值聚类算法来确定RBF的中心、梯度下降自适应算法优化网络宽度参数和递推最小二乘法算法调整网络权值。并用国内煤矿的煤与瓦斯突出实测数据对该混合算法及模型进行了验证。实验结果表明,本研究的方法在预测精度和收敛速度上均优于BPNN和基于经典k均值聚类算法的RBFNN,具有良好的实用性和有效性。  相似文献   

9.
基于粒子群优化算法的聚类分析   总被引:18,自引:0,他引:18  
基于求解实优化问题时粒子群算法优于遗传算法这一事实,在基于遗传算法的K-均值聚类算法的基础上,给出了一种摹于粒子群优化算法的聚类方法。实验结果显示,基于粒子群优化算法的聚类方法在收敛速度方面明显优于基于遗传算法的聚类方法。  相似文献   

10.
基于k均值分区的流数据高效密度聚类算法   总被引:2,自引:0,他引:2  
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号