首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
针对K-means异常检测算法检测性能低的问题,提出了一种结合信息熵与改进K-means算法的异常检测算法。该算法均匀地选出密度大于数据集平均密度的数据对象作为初始聚类中心,避免了初始中心的随机选择。在此基础上,引入了信息熵确定属性权重的方法来计算簇中数据点与该簇聚类中心的加权欧氏距离,通过对比簇中数据点的加权欧氏距离与该簇中所有数据点的平均加权欧氏距离来进行异常检测。实验表明,改进算法具有更高的检测率和更低的误检率,应用于电力负荷数据时检测率达到了90. 5%,能够有效地检测出异常的负荷数据。  相似文献   

2.
通过分析传统K-means聚类算法初始化随机和聚类结果难以体现对象间相关性的问题,提出了一种基于相关性加权改进的K-means算法.该算法通过引入能够反映对象间相关性程度的权衡因子皮尔逊相关性系数,利用经归一化后的相关性系数对欧式距离进行加权,对传统的K-means算法进行改进.实验结果表明:文中改进后的算法相比传统K-means算法和其它改进算法,在聚类质量上能获得更佳的聚类效果.  相似文献   

3.
为解决传统K-means算法初始质心的随机选取以及聚类过程中每个数据样本到聚类中心距离的重复计算问题,提出了一种高效的基于初始聚类中心优化的K-means算法,采用最小方差优化初始质心,通过存储每次迭代中所有数据点的簇标志和到最近聚类中心的距离并用于下一次迭代,避免了重复计算数据点到每个中心的距离。在UCI数据库中五个不同的数据集上进行了测试,对各个算法在聚类准则函数,运行时间以及迭代次数上进行实验结果比较,表明在不降低聚类性能的前提下,减少了迭代次数,缩短了聚类时间,证明了改进算法的有效性和高效性。  相似文献   

4.
针对K-均值聚类算法不能发现任意形状的聚类的问题,提出了一种基于非线性降维的聚类算法.在该算法中,首先用ISOMAP算法对数据集进行优化,然后再用K-means算法聚类.由于ISOMAP算法不能处理不连通的流形,本文提出了一种改进的ISOMAP算法,它能够发现不连通流形的低维嵌入.改进后的ISOMAP算法与K-means算法结果得到了一种有效的聚类算法.实验结果表明该算法能够发现任意形状的聚类.  相似文献   

5.
针对于K-means算法的缺点做出了一些改进,提出了一种基于KNN算法改进K-means的算法。改进后的算法解决了K-means算法K值无法确定和数据分类中的不强、易受异常数据干扰的缺点,提高了算法的聚类效果以及削弱初始聚类中心选择的随机性对于聚类结果易陷入局部最优的影响。实验表明,改进后的算法不仅解决了传统算法确定K值的问题,而且聚类结果稳定且聚类效果良好。  相似文献   

6.
为了解决在复杂的、数据量庞大的高光谱图像中汇集出参考价值较高的聚类组合问题,本文提出一种基于流形的K_Medoids改进算法并应用于高光谱图像的聚类实践中。该算法应用改进的Canopy算法进行初值选定,通过基于流形的测地距离所生成的像元距离矩阵来完成K_Medoids算法的聚类过程。该算法对传统聚类算法所具有的一些难以解决的弊端起到良好的抑制作用。利用AVIRIS图像对该算法进行验证,实验结果表明:与传统方法相比,该算法在类内距离、类间距离、Jaccard系数、Rand系数,以及聚类图像的直观对比五个评价标准下能够取得比传统方法更好的效果。  相似文献   

7.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.  相似文献   

8.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

9.
针对K-means在处理海量数据时,因初始聚类中心的选取不确定,从而导致收敛速度过慢的问题,本文提出了改进的K-means算法,首先用模糊聚类的思想对数据集进行模糊分类,其次采用动态计算聚类中心的方式对数据集进行二次分类,最后将算法在MapReduce模型上进行了实现.实验结果表明,改进后的算法不仅提高了加速比,而且算法的收敛速度更快.  相似文献   

10.
通过分析传统K-means算法难以确定聚类中心数目的问题,提出了一种改进的K-means聚类算法(CS-kmeans).该算法分析当聚类效果较好时最大类内距离与最小类间距离之间的关系,使用类内距离小于最小类间距离以及类间距离大于最大类内距离实现对类别数的自动分割与合并,从而确定适当的聚类数目.实验结果表示,文中改进后的算法相比传统K-means算法和其他改进算法,对于确定聚类中心数目、提高聚类质量是更为有效的.  相似文献   

11.
数据挖掘技术中聚类算法的改进研究   总被引:1,自引:0,他引:1  
针对K-means算法所存在的问题进行了深入的研究,提出了基于密度和聚类对象方向的改进算法(KADD算法).该算法采取聚类对象分布密度方法来确定初始聚类中心,然后根据对象的聚类方向来发现任意形状的簇.理论分析与实验结果表明,改进算法在不改变时间、空间复杂度的情况下能取得更好的聚类结果.  相似文献   

12.
一种优化初始化中心的k均值web信息聚类算法   总被引:1,自引:0,他引:1  
k-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于k-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。针对k-means算法所存在的问题,构造了文本集合的相似度矩阵,基于平均相似度集合通过排序迭代优选出了初始中心点。实验表明此算法可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。  相似文献   

13.
判断聚类结果中是否存在误分类的簇,即簇中包含的样本不属于同一类。若存在,则在已有聚类结果上使用加权方案,处罚误分类的簇,输出新的聚类结果。若不存在,则输出已有聚类结果。限制簇集中存在误分类的簇,消除初始聚类中心对K-均值算法的影响,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在坏的初始化条件下,表现出更好的鲁棒性;在含有噪音的数据集中,表现出更好的抗噪性能;聚类效果更好。  相似文献   

14.
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动。针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优。首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心。实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类。  相似文献   

15.
基于K-均值聚类算法RBF神经网络交通流预测   总被引:1,自引:0,他引:1  
针对目前道路拥堵等交通问题,本文采用K-均值聚类算法对径向基函数(radial basis function,RBF)网络进行优化,通过K-均值聚类算法把所有的输入样本进行统一聚类,求得所有隐含层节点的RBF中心值Ci,并用最小二乘法(LMS)进行RBF网络的权值调整,同时在一定的时间和路段内对车流量进行数据采集,通过建立RBF神经网络模型,运用Matlab软件把采集的数据、图像进行计算机仿真,仿真结果表明,未加入K-均值聚类的RBF神经网络,其预测输出曲线大致可以和实际输出曲线拟合,但在数据波动较大的时刻,预测曲线的收敛速度偏慢且效率偏低;而采用K-均值聚类算法的RBF神经网络,在实际输出波动较大时,预测输出的曲线收敛速度和准确度都较高,因此,本研究相对于普通的BP神经网络,有更高的预测精度和较好的收敛性。该研究适用于市区内的交通流预测。  相似文献   

16.
传统K-means聚类算法的性能依赖于初始聚类中心的选择。本文将复杂网络节点的属性值作为节点的度、聚集度与聚集系数的加权值,通过计算所有节点的加权综合聚集特征值,选取综合聚集特征值高,并且彼此之间无高聚集性特征的个节点作为聚类的初始聚类中心,然后进行聚类迭代过程。实验结果表明,新算法对初始聚类中心的选取更迅速有效,避免了传统K-means算法初始聚类节点选取的敏感性,进而提高K-means算法的聚类质量。  相似文献   

17.
针对农业遥感数据分类速度慢的问题,本文对K-means算法的并行化方法进行了研究,提出了一种基于网格计算的快速分类算法.在实现K-means并行算法过程中,通过调整通信数据的存储方式,使该算法每次迭代的通信次数降低为一次全收集操作.该算法节点数的选取是根据数据规模和分类需求确定的,而不是节点数越多算法效率越高.实验结果表明,这种方法具有较好的加速比.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号