共查询到19条相似文献,搜索用时 46 毫秒
1.
针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局最优位置及邻域最优位置线性组合改进位置公式.另一方面,构造一种基于余弦函数和对数函数的惯性权重,实现对惯性权重的动态调整.此外,引入AKM聚类算法确定聚类数,动态获取初始中心,进一步提高算法的准确性.仿真实验表明,改进的ISMPSO-AKM算法具有更快的收敛速度,更高的求解精度及更稳定的聚类结果. 相似文献
2.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。 相似文献
3.
提出一种适用于大型数据集的分布式聚类算法。该算法以传统的K-means算法为基础进行合理的改进,使之更适用于分布式环境,并从算法的复杂度分析,将该算法与传统的集中式K-means算法及其他分布式算法进行比较。实验表明,该算法在保持了集中式K-means算法所有必要特性的同时,提高了数据处理速度。 相似文献
4.
K-means算法因其简单、易理解、速度快等优点在众多领域得到广泛的应用,然而该算法的K值选取,初始聚类点的选取和对于孤立点的处理等都会影响最终聚类结果.根据k-means算法目前的应用研究现状,针对这些缺点对算法进行改进,最后指出了改进中存在的一些问题,并指出未来的研究方向. 相似文献
5.
基于划分的数据挖掘K-means聚类算法分析 总被引:1,自引:0,他引:1
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 相似文献
6.
7.
8.
首先提出了一种优化初始中心点方法用以解决聚类的局部最优问题.同时通过样本的模糊加权减少边缘噪音数据对聚类效率的影响.文本聚类试验表明,该模糊文本聚类算法取得较好的聚类效果. 相似文献
9.
10.
11.
WANG Jin XU Li ZHENG Bao-yu Deptartement of Information Engineering Nanjing University of Posts Telecommunications Nanjing P.R.China 《中国邮电高校学报(英文版)》2004,11(4)
The original clustering algorithms in Mobile Ad hoc Network(MANET)are firstly analyzed in this paper.Based on which,an Improved Weighted Clustering Algorithm(IWCA)is proposed.Then,the principle and steps of ouralgorithm are explained in detail,and a comparison is made between the original algorithms and our improved method inthe aspects of average cluster number,topology stability,clusterhead load balance and network lifetime.The experimentalresults show that our improved algorithm has the best performance on average. 相似文献
12.
传统层次聚类算法中经常会遇到合并点和分裂点选择的问题,一旦一组对象被合并或者分裂,下一步的处理将在新生成类上进行,已做处理不能撤销,这样有可能导致低质量的聚类结果.针对这个问题,文中提出了一种模糊加权层次聚类改进算法,每次分层聚类时先计算对象属于这个类可靠度,然后和阀值进行比较,当可靠度小于阀值时重新确定对象的归属类,这样就解决了上述问题.最后通过实验验证,该算法确实可行有效. 相似文献
13.
基于特征加权的模糊聚类新算法 总被引:41,自引:3,他引:41
在聚类分析中,针对不同类型的数据,人们设计了模糊k-均值、k-mode以及k-原型算法以分别适合于数值型、类属型和混合型数据.但无论上述哪种方法都假定待分析样本的各维特征对分类的贡献相同.为了考虑样本矢量中各维特征对模式分类的不同影响,本文提出一种基于特征加权的模糊聚类新算法,通过ReliefF算法对特征进行加权选择,不仅能够将模糊k-均值、k-mode以及k-原型算法合而为一,同时使样本的分类效果更好,而且还可以分析各维特征对分类的贡献程度.对各种实际数据集的测试实验结果均显示出新算法的优良性能. 相似文献
14.
15.
一种改进的基于密度的聚类算法 总被引:1,自引:0,他引:1
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分不同情况进行相应的聚类扩展,此算法可以有效减少聚类中核心点邻域重叠区域查询的次数和运行的时间,实验测试结果也表明该算法聚类的效率和质量明显优于DBSCAN算法. 相似文献
16.
17.
本文所涉及的降维思维是基于聚类过程和数据相似性产生的,界标等距映射算法在FCM-LI算法当中起到了至关重要的作用,在FCM中间结果对特征向量进行重新提取,尽可能减少特征向量维数,简单化处理FCM计算过程.结果表明,FCM-LI算法与传统高维数据直接分类算法相比,前者的优势比较体现在能够快速完成聚类过程.FCM-LI和FCM的差别在维数降到11维时约为3.95%,然而此时需消耗更多的时间来运行.将维数控制在5维时,此时运行时间最短,但不能确保其准确度,也意味着如果以过低的维数运行则将导致原数据出现错误,无法得到准确的分类结果. 相似文献
18.
为了更好地实现聚类,在分析层次聚类(agglomerative)算法和神经网络的ART2算法的基础上,提出了一种改进的层次聚类算法.改进算法将首先采用一种基于ART2的改进神经网络聚类算法得到一个初始的聚类结果,然后在此基础上利用agglomerative算法实现分层聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好. 相似文献