首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局最优位置及邻域最优位置线性组合改进位置公式.另一方面,构造一种基于余弦函数和对数函数的惯性权重,实现对惯性权重的动态调整.此外,引入AKM聚类算法确定聚类数,动态获取初始中心,进一步提高算法的准确性.仿真实验表明,改进的ISMPSO-AKM算法具有更快的收敛速度,更高的求解精度及更稳定的聚类结果.  相似文献   

2.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。  相似文献   

3.
提出一种适用于大型数据集的分布式聚类算法。该算法以传统的K-means算法为基础进行合理的改进,使之更适用于分布式环境,并从算法的复杂度分析,将该算法与传统的集中式K-means算法及其他分布式算法进行比较。实验表明,该算法在保持了集中式K-means算法所有必要特性的同时,提高了数据处理速度。  相似文献   

4.
常彤 《通讯世界》2017,(19):289-290
K-means算法因其简单、易理解、速度快等优点在众多领域得到广泛的应用,然而该算法的K值选取,初始聚类点的选取和对于孤立点的处理等都会影响最终聚类结果.根据k-means算法目前的应用研究现状,针对这些缺点对算法进行改进,最后指出了改进中存在的一些问题,并指出未来的研究方向.  相似文献   

5.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

6.
针对传统K-means算法对初始聚类中心选取的问题,提出了基于数据样本密度和距离来选取初始聚类中心的改进K-means算法,该算法保证了初始中心点集的第一点为确定的(最大密度点),在基于距离最远的其他中心点搜索过程中,得到的中心点也基本上是确定的,消除了初始中心点选择的随机性,同时保证了获得较高质量的初始中心点。理论分析和实验结果表明:改进的k-means算法是一种有效的入侵检测方法,根据此方法设计的入侵检测系统是有效可行的。  相似文献   

7.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

8.
首先提出了一种优化初始中心点方法用以解决聚类的局部最优问题.同时通过样本的模糊加权减少边缘噪音数据对聚类效率的影响.文本聚类试验表明,该模糊文本聚类算法取得较好的聚类效果.  相似文献   

9.
10.
《信息技术》2019,(11):20-23
文中对大数据聚类算法K-means算法及其优化进行研究,并主要针对确定聚类数目和初始中心给出了优化的算法。首先,利用平均误差平方和的指标来评估聚类结果的好坏,从而确定聚类的数目;其次,利用秩序化原始数据的方法进而实现有序选取初始中心;最终由结果分析看出,优化后算法相比于传统算法,聚类效果更好。  相似文献   

11.
The original clustering algorithms in Mobile Ad hoc Network(MANET)are firstly analyzed in this paper.Based on which,an Improved Weighted Clustering Algorithm(IWCA)is proposed.Then,the principle and steps of ouralgorithm are explained in detail,and a comparison is made between the original algorithms and our improved method inthe aspects of average cluster number,topology stability,clusterhead load balance and network lifetime.The experimentalresults show that our improved algorithm has the best performance on average.  相似文献   

12.
传统层次聚类算法中经常会遇到合并点和分裂点选择的问题,一旦一组对象被合并或者分裂,下一步的处理将在新生成类上进行,已做处理不能撤销,这样有可能导致低质量的聚类结果.针对这个问题,文中提出了一种模糊加权层次聚类改进算法,每次分层聚类时先计算对象属于这个类可靠度,然后和阀值进行比较,当可靠度小于阀值时重新确定对象的归属类,这样就解决了上述问题.最后通过实验验证,该算法确实可行有效.  相似文献   

13.
基于特征加权的模糊聚类新算法   总被引:41,自引:3,他引:41  
在聚类分析中,针对不同类型的数据,人们设计了模糊k-均值、k-mode以及k-原型算法以分别适合于数值型、类属型和混合型数据.但无论上述哪种方法都假定待分析样本的各维特征对分类的贡献相同.为了考虑样本矢量中各维特征对模式分类的不同影响,本文提出一种基于特征加权的模糊聚类新算法,通过ReliefF算法对特征进行加权选择,不仅能够将模糊k-均值、k-mode以及k-原型算法合而为一,同时使样本的分类效果更好,而且还可以分析各维特征对分类的贡献程度.对各种实际数据集的测试实验结果均显示出新算法的优良性能.  相似文献   

14.
基于密度和聚类指数改进的K-means算法   总被引:1,自引:0,他引:1  
传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离最大的两对对象均值当成第一轮聚类的聚类中心,新的聚类中心可通过最大距离积法获取,并参考聚类指数确定合适的k值。通过进行实验确认了该算法有较高的准确性和有效性。  相似文献   

15.
一种改进的基于密度的聚类算法   总被引:1,自引:0,他引:1  
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分不同情况进行相应的聚类扩展,此算法可以有效减少聚类中核心点邻域重叠区域查询的次数和运行的时间,实验测试结果也表明该算法聚类的效率和质量明显优于DBSCAN算法.  相似文献   

16.
基于数据加权策略的模糊聚类改进算法   总被引:2,自引:0,他引:2  
该文提出了一种数据指数加权的模糊均值聚类策略,引入了指数权因子和影响指数,使得可以在聚类过程中差异化处理各个数据。新策略和现有的Gustafson-Kessel(G-K)算法相结合,提出了一种新的模糊聚类算法DWG-K用于提高聚类质量和挖掘离群点。数据试验表明DWG-K在提高聚类质量方面优于现有的G-K;在离群点挖掘方面,DWG-K对离群点的判定是全局的,离群点的物理意义清楚,且计算效率明显高于当前广泛采用的基于密度的离群点挖掘算法。  相似文献   

17.
本文所涉及的降维思维是基于聚类过程和数据相似性产生的,界标等距映射算法在FCM-LI算法当中起到了至关重要的作用,在FCM中间结果对特征向量进行重新提取,尽可能减少特征向量维数,简单化处理FCM计算过程.结果表明,FCM-LI算法与传统高维数据直接分类算法相比,前者的优势比较体现在能够快速完成聚类过程.FCM-LI和FCM的差别在维数降到11维时约为3.95%,然而此时需消耗更多的时间来运行.将维数控制在5维时,此时运行时间最短,但不能确保其准确度,也意味着如果以过低的维数运行则将导致原数据出现错误,无法得到准确的分类结果.  相似文献   

18.
为了更好地实现聚类,在分析层次聚类(agglomerative)算法和神经网络的ART2算法的基础上,提出了一种改进的层次聚类算法.改进算法将首先采用一种基于ART2的改进神经网络聚类算法得到一个初始的聚类结果,然后在此基础上利用agglomerative算法实现分层聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好.  相似文献   

19.
黄鹏飞  张道强 《电子学报》2008,36(Z1):50-54
 本文提出了一种用于聚类分析的加权聚类算法,通过利用拉普拉斯权,将聚类对象之间的结构信息自动转换为对象的权重.由于拉普拉斯权能够描述数据的邻域结构,从而能够更好的聚类.该加权聚类算法在性能上比经典聚类算法有较大改进,还具有对孤立点鲁棒、适合类别不平衡数据聚类、对聚类个数不敏感等优点.人工数据集以及UCI标准数据集上的实验证实了本文算法的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号