首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性.  相似文献   

2.
针对传统近邻传播聚类算法不能进行限定类簇数目的聚类缺陷,提出一种三阶段的改进聚类方法。该方法通过近邻传播聚类从数据集中获得中心代表点集合,利用K-means算法对中心代表点集合进行指定类簇数目的聚类进而获得初始训练集,结合改进的K最近邻算法实现数据的聚类分析。采用人工仿真数据及UCI数据集进行对比实验,实验结果分析表明,与近邻传播聚类算法和传统限定类簇数目的聚类算法相比,新聚类算法具有更好的聚类效果。  相似文献   

3.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

4.
在各种聚类算法中,基于目标函数的K-均值聚类算法应用最为广泛,然而,K-均值算法对初始聚类中心特别敏感,聚类结果易收敛于局部最优。为此,提出基于加权处罚的K-均值优化算法。每次迭代过程中,根据簇的平均误差的大小为簇分配权值,构造加权准则函数,把样本分给加权距离最小的簇中。限制簇集中出现平均误差较大的簇,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在含有噪音的数据集中,表现出更好的抗噪性能,聚类效果更好。  相似文献   

5.
引入能量限制项来提高聚类算法对能量的敏感性。在聚类过程中,最优聚类数由cos指数的最大值决定。仿真结果表明,与LEACH算法相比,该算法能够获得合理的簇头节点分布,延迟了第一个节点的死亡时间。延长了网络生命周期,平衡节点的能耗。  相似文献   

6.
判断聚类结果中是否存在误分类的簇,即簇中包含的样本不属于同一类。若存在,则在已有聚类结果上使用加权方案,处罚误分类的簇,输出新的聚类结果。若不存在,则输出已有聚类结果。限制簇集中存在误分类的簇,消除初始聚类中心对K-均值算法的影响,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在坏的初始化条件下,表现出更好的鲁棒性;在含有噪音的数据集中,表现出更好的抗噪性能;聚类效果更好。  相似文献   

7.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.  相似文献   

8.
随着智能电网建设的深入,许多智能仪表被接入电网以获取用户的实时负荷数据。由于用户数量众多,单独对个体进行数据处理和分析是不现实的,所以需要对用户进行分类。采用模糊聚类算法来处理负荷侧不同用户的用电负荷数据,随机抽取了某小区的25个用户数据,并对其用电行为进行了分类。结合聚类有效性指标得到了算法的最佳聚类数,并进行了仿真分析。结果表明,模糊聚类算法在负荷侧不同用户用电行为分类中有着较好的表现。  相似文献   

9.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

10.
为应对大数据环境下用户用电的最佳聚类数的选择问题,提出一种用户用电行为的聚类优选策略;针对用户用电的行为复杂性和特征选择的有效性,通过一种基于信息量的方法对用户用电进行聚类。首先,引入评价指标,提出一种合理的聚类优选方法。然后,针对用户用电特征选择,提出基于互信息的特征优选算法。在传统聚类算法中,聚类数是随机给定的,其值选取不合理会使聚类陷入局部最优,基于此,根据“类内相似度最大化,类间相似度最小化”原理,提出距离评价函数并将其作为评判最佳聚类数的标准,采用多种方法进行综合分析得到最优聚类数。最后,用具体的用电数据对用户进行计算机仿真,验证了聚类优选策略的合理性。以自适应分布式聚类算法作为对比算法,进一步验证了所提算法的有效性。  相似文献   

11.
针对物联网环境下实时数据挖掘中资源约束的特点,分析了快速有效地挖掘抽取知识的方法。在K-means算法的基础上,结合RA-Cluster算法,提出了ARRA-Kmeans聚类算法。并基于环境资源约束和时间约束的特点,引入自适应聚类方法和滑动窗口技术,对网络节点的实时数据进行挖掘。实验结果表明,随着流数据量的增大,ARRA-Kmeans算法在处理实时动态的数据时具有较好的效果,聚类精度较高,处理时间较快。  相似文献   

12.
K-均值算法对初始聚类中心敏感,聚类结果随不同初始聚类中心波动。针对以上问题,提出一种基于最小方差的自适应K-均值初始化方法,使初始聚类中心分布在K个不同样本密集区域,聚类结果收敛到全局最优。首先,根据样本空间分布信息,计算样本方差得到样本紧密度信息,并基于样本紧密度选出满足条件的候选初始聚类中心;然后,对候选初始聚类中心进行处理,筛选出K个初始聚类中心。实验证明,算法具有较高的聚类性能,对噪声和孤立点具有较好的鲁棒性,且适合对大规模数据集聚类。  相似文献   

13.
针对协同过滤推荐系统存在的数据稀疏性和扩展性差问题,提出了初始聚类中心优化的K-均值项目聚类推荐算法。该算法首先采用SlopeOne方法对评分矩阵预测填充来缓解数据稀疏性,然后采用初始聚类中心优化的K-均值算法对项目进行聚类,将相似度高的项目聚到同一个类中,最后根据目标项目所在的聚类搜索其最近邻并产生推荐。实验结果表明,该算法有效改善了数据的稀疏性和扩展性,提高了推荐质量。  相似文献   

14.
深入挖掘用户用电行为是电力大数据背景下电力市场精细化发展的迫切需求。为满足该需求,提出了一种基于平滑异同移动平均线(MACD)指标提取特征的聚类分析方法。该方法首先计算用户用电量的MACD指标;然后以MACD指标为特征,采用K-means聚类算法对用户进行分类;最后利用分析股票的思想分析每一类用户的用电行为。对美国某一地区的实测居民用电量数据进行了算例分析,结果表明所提方法与传统方法相比具有更好的聚类效果,并且拓展了用户用电行为分析方式。  相似文献   

15.
基于核K-均值聚类和支持向量机结合的说话人识别方法   总被引:1,自引:0,他引:1  
提出了基于核K-均值聚类方法与支持向量机结合的说话人识别方法,为每两个人建立一个支持向量机,对支持向量机输入的语音信号先进行核K-均值聚类,并选取有效样本作为支持向量机的输入,本文提出的聚类方法能够去更好的聚类并约简数据,提高了识别率.实验比较了在用支持向量机作为分类器的情况下,该核聚类与传统聚类方法的训练速度和识别性能,验证了本文提出方法的有效性.  相似文献   

16.
Anomaly detection and recognition are of prime importance in process industries.Faults are usually rare,and, therefore,predicting them is difficult.In this paper,a new greedy initialization method for the K-means algorithm is proposed to improve traditional K-means clustering techniques.The new initialization method tries to choose suitable initial points,which are well separated and have the potential to form high-quality clusters.Based on the clustering result of historical disqualification product data in manufacturing process which generated by the Improved-K-means algorithm,a prediction model which is used to detect and recognize the abnormal trend of the quality problems is constructed.This simple and robust alarm-system architecture for predicting incoming faults realizes the transition of quality problems from diagnosis afterward to prevention beforehand indeed.In the end,the alarm model was applied for prediction and avoidance of gear-wheel assembly faults at a gear-plant.  相似文献   

17.
Anomaly detection and recognition are of prime importance in process industries. Faults are usually rare, and, therefore, predicting them is difficult. In this paper, a new greedy initialization method for the K-means algorithm is proposed to improve traditional K-means clustering techniques. The new initialization method tries to choose suitable initial points, which are well separated and have the potential to form high-quality clusters. Based on the clustering result of historical disqualification product data in manufacturing process which generated by the Improved-K-means algorithm, a prediction model which is used to detect and recognize the abnormal trend of the quality problems is constructed. This simple and robust alarm-system architecture for predicting incoming faults realizes the transition of quality problems from diagnosis afterward to prevention beforehand indeed. In the end, the alarm model was applied for prediction and avoidance of gear-wheel assembly faults at a gear-plant.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号