首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对经典k_均值聚类方法只能处理静态数据聚类的问题,本文提出一种能够处理动态数据的改进动态k-均值聚类算法,称为Dynamical K-means算法.该方法在经典k-均值方法的基础上,通过对动态变化的数据集中 新加入样本进行分析和处理,根据聚类目标函数改变的实际情况选择最相似的类别进行局部更新或进行全局经典k_均值聚类,有效检测发生聚类概念漂移和没有发生聚类概念漂移的情况,从而实现了动态数据的在线聚类,避免了经典k_均值方法在动态数据中每次都要对全部数据重新聚类而导致算法速度过慢的问题.标准数据集和人工社会网络数据集上的实验结果表明,与经典k_均值聚类方法相比,本文提出的动态k_均值聚类方法能快速高效地处理动态数据聚类问题,并有效地检测动态数据聚类过程中所产生的概念漂移问题.  相似文献   

2.
一种改进的k-均值聚类算法   总被引:4,自引:0,他引:4  
针对k-均值(k-means)聚类算法中随机选取初始聚类中心的缺陷,提出了一种新的基于数据样本分布选取初始聚类中心的方法.实验结果表明,改进后的算法能改善其聚类性能,并能取得较高的分类准确率.  相似文献   

3.
针对传统K-均值聚类方法不能有效处理大规模数据聚类的问题,提出一种基于随机抽样的加速K-均值聚类(K-means Clustering Algorithm Based on Random Sampling , Kmeans_RS)方法,以提高传统K-均值聚类方法的效率。首先从大规模的聚类数据集中进行随机抽样,得到规模较小的工作集,在工作集上进行传统K-均值聚类,得到聚类中心和半径,并得到抽样结果;然后通过衡量剩下的聚类样本与已得到的抽样结果之间的关系,对剩余的样本进行归类。该方法通过随机抽样大大地减小了参与K-均值聚类的问题规模,从而有效提高了聚类效率,可解决大规模数据的聚类问题。实验结果表明,Kmeans_RS方法在大规模数据集中在保持聚类效果的同时大幅度提高了聚类效率。  相似文献   

4.
郑芸芸  王萍  游强华 《福建电脑》2013,(12):103-104,111
由于k-均值经典算法必须在聚类前随机地选择聚类的个数k,则后所得到的聚类结果会受到初始选择的聚类个数的影响。针对这个问题,根据寻找最优初值及免受孤立点影响的思想,提出了一种改进的k-均值聚类算法。实验证明改进的k-均值聚类算法在一定程度上解决了该算法对初始值的依赖,并部分减少了算法受噪声数据影响的可能。  相似文献   

5.
一种有效k-均值聚类中心的选取方法   总被引:2,自引:0,他引:2  
基于k-均值算法的思想和关键技术,本文对于k-均值算法中的初始点的选取进行了深入的研究,提出了一种高性能初始点的选取算法并用实际数据进行测试,通过与常规的随机选取方法的比较,该算法具有更好的性能和健壮性。  相似文献   

6.
模糊k-平面聚类算法   总被引:2,自引:1,他引:1  
在k-平面聚类(kPC)算法的基础上,通过引入模糊隶属关系,提出模糊k-平面聚类(FkPC)算法.与kPC类似,FkPC同样从原型选择的角度出发,以k个超平面替代传统的点(类中心)作为聚类原型.同时,由于模糊隶属度的引入,FkPC更能体现各样本点和与之对应的聚类平面的隶属关系.在人工数据集和标准数据集上的实验,均证实了FkPC算法的聚类有效性.更深入地揭示出除相似性度量之外,原型表示对聚类结果同样有着至关重要的影响.  相似文献   

7.
郑芸芸  王萍  游强华 《福建电脑》2013,(11):106-107,124
朴素贝叶斯分类器是建立在条件独立性假设上的,但在实际运用过程中这种假设通常是不存在的。针对这个问题,结合k-均值聚类算法构造出了一个改进的朴素贝叶斯分类器。算法用k-均值算法将其中相关系数较大的属性合并成一个综合属性,使随后进行贝叶斯分类的各个属性间能尽可能达到属性独立,达到朴素贝叶斯分类器的要求。实验证明这种方法改善了朴素贝叶斯分类器并扩大了朴素贝叶斯分类器的应用范围。  相似文献   

8.
邱强 《数字社区&智能家居》2014,(12):2825-2827,2844
针对传统K-近邻(K-Nearest Neighbor,K-NN)分类方法不能高校处理大规模训练数据的分类问题,该文提出一种并行的改进K-NN(Improved Parallel K-Nearest Neighbor,IPK-NN)分类方法。该方法首先将大规模训练样本随机划分为多个独立同分布的工作集,对于任意一个新来的待检测样本,在每个工作集上采用标准K-NN方法对该样本进行标记,然后综合各训练集的标记结果,得到该样本的最终标记。实验结果表明,在大规模数据集的分类问题中,IPK-NN方法能够在保持较高分类精度的同时提高模型的学习效率。  相似文献   

9.
实际生活中,经常会遇到大规模数据的分类问题,传统k-近邻k-NN(k-Nearest Neighbor)分类方法需要遍历整个训练样本集,因此分类效率较低,无法处理具有大规模训练集的分类任务。针对这个问题,提出一种基于聚类的加速k-NN分类方法 C_kNN(Speeding k-NN Classification Method Based on Clustering)。该方法首先对训练样本进行聚类,得到初始聚类结果,并计算每个类的聚类中心,选择与聚类中心相似度最高的训练样本构成新的训练样本集,然后针对每个测试样本,计算新训练样本集中与其相似度最高的k个样本,并选择该k个近邻样本中最多的类别标签作为该测试样本的预测模式类别。实验结果表明,C_k-NN分类方法在保持较高分类精度的同时大幅度提高模型的分类效率。  相似文献   

10.
基于核的K-均值聚类   总被引:17,自引:0,他引:17  
孔锐  张国宣  施泽生  郭立 《计算机工程》2004,30(11):12-13,80
将核学习方法的思想应用于K-均值聚类中,提出了一种核K-均值聚类算法,算法的主要思想是:首先将原空间中待聚类的样本经过一个非线性映射,映射到一个高维的核空间中,突出各类样本之间的特征差异,然后在这个核空间中进行K-均值聚类。同时还将一种新的核函数应用于核K-均值聚类中以提高算法的速度。为了验证算法的有效性,分别利用人工和实际数据进行K-均值聚类和核K-均值聚类,实验结果显示对于一些特殊的类分布数据,核K-均值聚类比K-均值聚类具有更好的聚类效果。  相似文献   

11.
基于节点生长k-均值聚类算法的强化学习方法   总被引:3,自引:0,他引:3  
处理连续状态强化学习问题,主要方法有两类:参数化的函数逼近和自适应离散划分.在分析了现有对连续状态空间进行自适应划分方法的优缺点的基础上,提出了一种基于节点生长k均值聚类算法的划分方法,分别给出了在离散动作和连续动作两种情况下该强化学习方法的算法步骤.在离散动作的MountainCar问题和连续动作的双积分问题上进行仿真实验.实验结果表明,该方法能够根据状态在连续空间的分布,自动调整划分的精度,实现对于连续状态空间的自适应划分,并学习到最佳策略.  相似文献   

12.
一种结合人工蜂群和K-均值的混合聚类算法   总被引:1,自引:1,他引:1  
传统的K-均值聚类算法虽然收敛速度快,但由于过度依赖初始聚类中心,算法的鲁棒性较差。为此,提出了一种改进人工蜂群算法与K-均值相结合的混合聚类方法,将改进人工蜂群算法能调节全局寻优能力与局部寻优能力的优点与K-均值算法收敛速度快的优点相结合,来提高算法的鲁棒性。实验表明,该算法不仅克服了传统K-均值聚类算法稳定性差的缺点,而且聚类效果也有了明显改善。  相似文献   

13.
近几年来,随着互联网的发展以及大数据时代的来临,具有多种表示即多视图数据越来越多,如何将传统的单一表示的数据聚类方法应用在多视图数据被广泛研究。其中传统的K-均值聚类算法因为有效性以及对于大数据的高效性而被扩展到了多视图数据领域,本文针对最近提出的一个新的多视图K-均值聚类方法,结合co-training的思想,提出了一个改进的多视图K-均值聚类算法,并在三个标准数据集上进行了实验,同时和已有的一些方法进行了比较,结果表明了算法的有效性。  相似文献   

14.
基于K-均值聚类和凝聚聚类的离群点查找方法   总被引:1,自引:1,他引:1       下载免费PDF全文
离群点发现是数据挖掘研究的一个重要方面。根据数据流的特点,给出了一种基于K-均值聚类和凝聚聚类的离群点发现方法,先用K-均值聚类对数据流进行处理,生成中间聚类结果,然后用凝聚聚类对这些中间结果进行再次选择,最后找出可能存在的离群点。  相似文献   

15.
李庆华  苏珊 《计算机工程》2005,31(5):151-152,161
由于入侵检测使用的数据集十分庞大,现有的串行聚类算法很难在合理的时间内得到结果。文章提出了一种应用于入侵检测的并行K-均值算法,给出了其加速比估算公式,实验证明了算法的正确性和有效性。  相似文献   

16.
传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值.将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的.同时分别设计出新的交叉算子和变异算子,并且使用的聚类有效性指标DB-Index作为目标函数,该算法很好地解决了聚类中心优化问题,与之前的两种算法相比,改进后的算法改善了聚类的质量,提高了全局的收敛速度.  相似文献   

17.
基于粗糙集的K-均值聚类图象分割方法   总被引:1,自引:0,他引:1  
粗糙集理论是一种新的处理含糊和不确定性问题的数学工具,该文结合粗糙集理论和K-均值聚类算法,提出了一种图象分割的方法。将原图象按等价关系进行划分,基于属性约简的概念对不同区域按照不可分辨关系分类。分割结果表明,该文方法是一种有效的图象分割方法,具有良好的鲁棒性。  相似文献   

18.
本文提出了一种基于隐马尔可夫模型的二次k-均值聚类算法并实现了对基因序列数据的建模与聚类。算法首先引入了同源基因序列核苷酸比率趋向于一致的生物学特征来对基 因序列数据进行初次k-均值聚类,然后利用第一次聚类结果训练出表征序列特征的隐马尔可夫模型,最后采用基于模型的k-均值方法再次聚类。实验结果表明,该算法是可行的,,并且具有较好的聚类质量。  相似文献   

19.
《软件工程师》2017,(11):10-14
为了解决分形图像编码耗时过长的问题,该论文主要研究了基于K-均值聚类的快速分形编码算法。首先引入方差法将子块分为简单块和复杂块,随后采用K-均值聚类算法对复杂子块及父块进行分类,并在搜索匹配父块的过程中运用近邻搜索法,使得相应子块仅在近邻范围内与同类的父块进行匹配运算。该方法对匹配块的搜索过程进行了优化,大幅度减少了编码时间。测试结果表明,与基本分形编码算法相比可提速多倍,并且其重构图像效果较好。  相似文献   

20.
在分析单词-文档谱聚类方法的基本步骤,找出其对初始值敏感的根本原因的基础上,提出一种基于模糊-调和均值的单词-文档谱聚类方法.首先从矩阵相似的角度对谱聚类中的Laplacian矩阵进行处理,使其满足对初始值不敏感的条件;然后通过加入模糊的概念,用模糊K-调和均值算法代替K-均值算法,使聚类结果对初始值不敏感.实验结果表明,所提出的方法不仅使聚类结果对初始值不敏感,而且在一定程度上提高了数据的鲁棒性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号