首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 55 毫秒
1.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性.  相似文献   

2.
基于主成分分析的密度聚类算法   总被引:1,自引:0,他引:1  
密度聚类算法可以描述任意形状的聚类,可以有效地处理异常数据,适合处理大数据集,但不适用于高维数据集的聚类,因此提出了基于主成分分析的密度聚类算法,将DBSCAN算法应用于PCA的k个主成分张成的子空间,解决了DBSCAN算法用于高维数据集的问题.运用气象数据进行实验,结果表明:主成分个数k值的选择严重影响聚类效果,故提出k的基本选择方法,正确选择k值情况下,该算法具有较好的聚类效果.  相似文献   

3.
传统的k-means聚类算法常陷入局部最优,需要事先输入聚类数,这样会造成原有算法失效或聚类结果不准确。在研究现有聚类算法的基础上,使用ε-最近邻法剔除孤立点,提出一种改进的基于模拟退火算法的、具有自适应功能的k-means聚类算法。实验结果证明,提出的算法是可行的、有效的。  相似文献   

4.
传统的k-means聚类算法常陷入局部最优,需要事先输入聚类数,这样会造成原有算法失效或聚类结果不准确.在研究现有聚类算法的基础上,使用ε-最近邻法剔除孤立点,提出一种改进的基于模拟退火算法的、具有自适应功能的k-means聚类算法.实验结果证明,提出的算法是可行的、有效的.  相似文献   

5.
为了提高财务数据分析的准确度。文中采用密度峰值聚类算法进行财务数据聚类分析,实现财务数据的深度分析。通过对财务数据样本进行特征提取,建立密度峰值聚类财务分析模型。根据密度峰值聚类的核函数计算密度值,对距离值和密度值按降序排序,选择较大值所对应的样本点作为若干聚类中心。通过计算各节点和各个聚类中心点的距离,根据设定的距离阈值来判定样本类别。为了防止距离阈值设置不合理而对聚类结果造成较大扰动,引入果蝇优化算法对距离阈值参数进行优化改进,通过果蝇群体对味道浓度的不断更新优化,获得最优适应度个体。采用经过果蝇优化算法优化后的密度峰值聚类算法完成聚类分析,获得财务数据聚类结果。实验结果表明:通过合理设置果蝇优化算法气味变化率范围等参数,对于6类行业样本的聚类准确率均超过了0.9。相比于常用财务数据分析聚类算法,经过果蝇优化算法改进的密度峰值聚类算法能够获得更高的聚类准确率和稳定性。  相似文献   

6.
针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类...  相似文献   

7.
针对凝聚式的层次聚类算法在聚类过程中层次化的迭代运算使误差不断累积,导致聚类结果较差的问题,在GN快速算法基础上提出了一种改进的凝聚式层次聚类算法,即网状聚类算法。实验结果表明,该改进算法避免了误差的积累,可以获得更高质量的聚类结果。  相似文献   

8.
提出并设计了一种用于高维稀疏相似矩阵的文本聚类算法.该算法结合了层次聚类和划分聚类的思想,通过一个阈值来控制聚类算法的选取和新簇的建立.从一个小样本的实验结果来看,该算法的召回率和正确率比各种经典的方法更高.  相似文献   

9.
分析了基于内容过滤的反垃圾邮件技术存在的不足,如概念漂移和偏斜类分布会导致召回率降低.在Minoru Sasaki和Hiroyuki Shinnou提出的邮件检测方法的基础上,对特征选择算法做了改进,并增加了自动学习机制,提出了一种基于改进K-均值聚类的垃圾邮件过滤算法.实验表明此方法能较好地适应概念漂移和偏斜类分布现象.  相似文献   

10.
传统的k-means算法是一种局部搜索算法,对初始化敏感,容易陷入局部极值。针对此缺点,提出一种基于k-means算法的改进的蚁群聚类算法,选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心,把正反馈、精英机制和变异算子引入到蚁群聚类。实验结果证明,算法不仅对初始数据具有弱依赖性,而且能够提高聚类的准确率,加快收敛。  相似文献   

11.
自适应的模糊C均值聚类算法   总被引:1,自引:0,他引:1  
针对模糊C均值聚类算法对聚类数预先不可知的缺陷,提出了自适应的模糊C均值聚类算法,该算法利用已有的有效性函数自动确定聚类数目,继而进行模糊聚类,实验表明,该方法无须人工的干预,并且具有良好的有效性和可行性.  相似文献   

12.
针对模糊C-均值聚类算法对聚类数预先不可知和谱系聚类所具有的缺陷,提出了混合模糊谱系聚类算法,该算法结合模糊聚类和谱系聚类,自动确定聚类数目,并可以有效的对数据进行聚类.实验表明,该算法具有良好的有效性和可行性.  相似文献   

13.
一种基于网格和密度凝聚点的快速聚类算法   总被引:10,自引:1,他引:10  
提出的快速聚类算法通过凝聚点来准确反映数据空间的几何特征,然后采用网格和密度相结合的方法,利用爬山法和连通性原理进行聚类处理,克服了传统网格聚类算法聚类质量降低的缺点.实验结果证明,本算法的聚类效率优于传统爬山法、Clique算法和DBSCAN算法.  相似文献   

14.
针对传统聚类算法存在时间性能低效且需要输入参数的缺点,本文提出了一种自动连结链聚类新算法.该算法在确立数据的基础上,通过计算数据点与各顶点的距离并加以排序形成不同群组,然后快速搜寻出它们的相邻点形成连结链网络,再根据连结链的平均距离删除过长的连结链,从而达到聚类的目的.实验结果表明,本文算法与DBSCAN及Single-Link算法具有相同的聚类效果,但执行时间约仅为这两种算法的10%.  相似文献   

15.
聚类算法初始聚类中心的优化   总被引:1,自引:0,他引:1  
对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考.  相似文献   

16.
The Circle algorithm was proposed for large datasets.The idea of the algorithm is to find a set of vertices that are close to each other and far from other vertices.This algorithm makes use of the connection between clustering aggregation and the problem of correlation clustering.The best deterministic approximation algorithm was provided for the variation of the correlation of clustering problem,and showed how sampling can be used to scale the algorithms for large datasets.An extensive empirical evaluation...  相似文献   

17.
针对单一聚类算法存在的不能泛化的问题,将集成学习技术应用于聚类算法中,集成学习技术可以显著提高学习系统的泛化能力。提出了1种基于粒子群和遗传算法的协同进化聚类集成算法,粒子群算法保证算法快速收敛,遗传算法全局搜索扩大搜索范围,提高了聚类的性能和收敛速度。将本研究提出的算法在多个UCI数据集上进行试验验证,结果表明该算法是有效的。  相似文献   

18.
基于形状相似距离的K-means聚类算法   总被引:1,自引:0,他引:1  
把向量作为空间中的物体展开相似度的评估,分析了向量间各维差值与形状差异的间的近似关系,提出了基于形状相似距离的K-means算法。在三个UCI(University of California,Irvine)标准数据集上的聚类结果表明,对于有关形状信息的数据,基于形状相似距离的K-means算法比采用传统距离的K-means算法,聚类准确度显著提高。  相似文献   

19.
基于K均值聚类的定位算法分析   总被引:1,自引:0,他引:1  
李炜 《广西工学院学报》2012,23(3):45-48,76
在描述了聚类算法的基本思想和概念的基础上,介绍了一种常见的聚类算法—K均值和K中心点聚类算法,通过处理认知无线电网络中主用户定位在海量数据中应用K均值聚类算法,对该算法进行分析,仿真结果表明:与传统的主用户定位算法相比,使用K均值聚类算法能够有效地提高定位精度和降低定位算法的复杂度.  相似文献   

20.
免疫算法是在保留遗传算法优良特性的基础上有目的、有选择的利用待求问题中的特征信息来抑制进化过程中出现的种群退化现象,算法核心是免疫算子(接种疫苗和免疫选择)的构造。基于免疫遗传算法的聚类不仅能够有效克服传统聚类方法对初始化敏感、依赖聚类原型、进化后期容易早熟等缺点,而且聚类结果能够快速收敛到全局最优。本文将这种聚类方法用于网络异常检测中,构造基于免疫遗传聚类的异常检测系统,该系统可实现对海量异构多维原始数据的异常检测,并且能够检测到网络未知攻击。本文在KDD CUP99数据集中进行了对比仿真实验,实验结果表明该算法能够得到较高的已知攻击和未知攻击检测率以及较低的误警率,检测系统性能优良。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号