首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
提出了一种基于网格密度的混合聚类算法。该算法使用平方误差密度函数作为密度评估标准,避免了传统密度算法由于Eps和MinPts设置不当给聚类效果带来的不稳定因素。提出了动态邻域半径策略,解决了传统密度算法采用全局静态邻域半径造成的聚类偏差问题。对空间区域内的所有结点设置网格密度启发信息。在进行数据结构构造和邻域半径计算时,只需计算对应网格区域内结点,从而降低了计算成本;在进行区域查询时,只选择符合条件的代表对象进行扩展,从而减少了查询次数,节省了程序运行时间。对Pendigits数据集和SE-QUOIA 2000数据库进行测试,结果表明:提出的基于网格密度的混合快速聚类算法在海量数据聚类精度、聚类时间以及聚类稳定性上要优于传统的聚类算法。  相似文献   

2.
针对海量实时数据流,提出了一种基于密度和网格划分相结合的聚类算法.首先对数据空间进行划分,判断每个单元格中数据点的属性.如果单元格内数据点密度高于阈值,则判定这些点为核心点;否则,根据单元格邻居内数据点的数量对数据点进行再次判断,以确定单元格内的数据点是边界点还是噪声点.算法克服了基于密度的算法运行效率低的缺点,又弥补了基于网格的算法精度较低的不足.通过实验验证了算法的效率和性能,并与经典的DBSCAN和CLIQUE算法进行了对比分析.最后分析了算法在面向海量实时数据流方面所具有的优势,并提出了进一步的研究方向.  相似文献   

3.
数据聚类是数据挖掘中的关键一步.本文针对利用欧几里德距离作为相似性测算引起聚类结果的不稳定性,提出一种基于内聚力作为相似性测算的聚类方法.通过仿真比较,证明了该算法的优越性.  相似文献   

4.
作为数据挖掘的一项重要技术,聚类分析具有广泛的应用领域.同时,聚类也是数据挖掘领域中一个相对比较困难的问题.在聚类算法中,基于模糊划分的FCM算法是一种重要的算法.和其它的算法相比,FCM算法具有计算简单、运算速度快,且有比较直观的几何意义的优点,因此在图像处理、模式识别等领域得到了广泛的应用.和所有的c均值算法一样,FCM算法也是只用类中心来表示类,这样只是适合球状类型的簇.本文在目前FCM算法研究的基础上,讨论了传统FCM算法在原型初始化上的局限性.提出一种基于层次凝聚的改进算法,使之能够适用于不规则分布的数据.  相似文献   

5.
一种快速A P聚类算法   总被引:3,自引:0,他引:3  
Affinity propagation(AP)聚类算法中的一个重要参数-收敛系数(damping factor)对算法的运行效率有较大影响,而传统的AP算法中收敛系数常作为固定参数在算法运行中保持不变,因此AP算法的收敛性能对收敛系数初始值的选择比较敏感,针对这一问题提出了一种新的AP聚类算法:F-AP,该算法在传统AP聚类算法基础上引入收缩因子调节收敛系数,使其值能够随算法进程动态调整,以加速AP算法的收敛过程。在3个不同容量模拟数据集上进行了实验,结果表明,新算法能够有效加速收敛过程,并且能够保证与原算法相同的聚类结果;在标准数据集Iris上的聚类结果也表明了新算法具有较好的收敛性能。  相似文献   

6.
提出了一个基于密度和网格的子空间聚类算法.该算法运用启发式的密度连通思想来确定一维空间初始簇的生成,使用自底向上的搜索策略来发现存在子空间中的簇.实验结果表明,在处理高维数据时,在不牺牲算法的其他性能的同时提高了聚类的有效性,降低了对输入数据顺序及噪音数据的敏感性.  相似文献   

7.
一种基于网格和密度凝聚点的快速聚类算法   总被引:10,自引:1,他引:10  
提出的快速聚类算法通过凝聚点来准确反映数据空间的几何特征,然后采用网格和密度相结合的方法,利用爬山法和连通性原理进行聚类处理,克服了传统网格聚类算法聚类质量降低的缺点.实验结果证明,本算法的聚类效率优于传统爬山法、Clique算法和DBSCAN算法.  相似文献   

8.
针对密度聚类算法无法应用于大规模数据集的问题,提出一种基于划分网格的密度聚类算法(GDSCAN)。将大规模二维点阵图划分为若干网格,网格最短边不小于给定邻域半径,目标点所在网格中任意点的邻域范围不会超过与该网格直接连接的网格,只需在保留网格内寻找邻域点,从而减少计算量;聚类从任意无类别核心点开始,将该点的所有密度可达组成一个簇,以此类推直至所有核心点都有类别;采用提出的GDSCAN算法对不同数量级的二维路网节点进行聚类验证。结果表明,GDSCAN算法可有效解决大规模二维点阵数据集中密度聚类的效率问题,数据量越大,效果越明显,且时间复杂度明显降低。  相似文献   

9.
障碍约束下的空间聚类问题具有很强的实用价值,是近几年来空间数据挖掘研究领域的一个热点,研究和分析了现有的障碍约束空间聚类算法,针对其中存在的问题,提出了一种新的基于密度和网格的障碍约束下空间聚类算法,该算法在CLICQU算法的基础上,引入障碍网格的概念和障碍物的网格化表达,使其能够处理任意形状的障碍约束聚类,通过理论分析和实验验证,该算法具有较好的时间复杂度和聚类效果。  相似文献   

10.
针对基于密度带有“噪声”的空间聚类应用(DBSCAN)聚类算法存在的3个主要问题: 输入参数敏感、对内存要求高、数据分布不均匀时影响聚类效果,提出了一种基于遗传方法的DBSCAN算法改进方案数据分区中使用遗传思想的DBSCAN算法(DPDGA)来提高聚类质量.利用遗传算法改进K-means算法来获取初始聚类中心;对数据进行划分,在此基础上对划分的每一部分使用DBSCAN算法进行聚类;合并聚类的结果.仿真实验表明,新方法较好解决了传统DBSCAN聚类算法存在的问题,在聚类效率和聚类效果方面均优于传统DBSCAN聚类算法.  相似文献   

11.
一种优化初始化中心的k均值web信息聚类算法   总被引:1,自引:0,他引:1  
k-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于k-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。针对k-means算法所存在的问题,构造了文本集合的相似度矩阵,基于平均相似度集合通过排序迭代优选出了初始中心点。实验表明此算法可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。  相似文献   

12.
k-means是一种快速有效的聚类算法,但是随着数据量的增加,k-means算法的局限性日益突出。该文从数据预处理,初始聚类中心的选取,最佳聚类数的确定等几个方面优化了k-means算法。仿真实验表明,优化后的k-means算法在稳定性和准确性方面都有很大的提高,证明提出的算法有一定的价值。  相似文献   

13.
网格聚类在多雷达数据融合算法中的应用   总被引:1,自引:0,他引:1  
应用网格聚类的方法区分同一雷达接收的不同目标的观测数据,通过类间数据融合,实现同一目标不同雷达接收数据的融合,以便对多目标进行实时跟踪。研究了观测数据网格聚类的基本思想、形式化描述及算法实现,讨论了对机动目标跟踪的Kalman滤波方程及空管系统中易于计算的各参数矩阵理论依据及相应的初值。仿真结果表明,通过网格聚类能很好地区分不同目标,聚类后再进行跟踪融合更加准确。  相似文献   

14.
大规模数据集的多层聚类算法   总被引:1,自引:0,他引:1  
针对大多谱聚类算法由于计算复杂度高而不适于大规模数据的问题,提出了一种能处理大规模数据集的多层算法。该算法把海量数据根据一定的相关性逐级分组成小数据集,再对分组后的小数据集用谱聚类算法进行聚类,最后利用权核K均值聚类逐级微调,完成全部数据的聚类。通过对UCI数据库中的数据集和图像分割的仿真实验,结果表明该算法的聚类效果很好。  相似文献   

15.
针对现有的分簇算法因存在数据回传现象使节点在能量利用效率方面存在不足的问题,提出了一种面向数据聚集的有向分簇算法,使节点数据总是沿着接近Sink的方向传输,避免了数据回传带来的能量浪费.仿真实验结果表明,有向分簇算法具有较高的能量利用效率,能延长传感器网络的生存周期.  相似文献   

16.
首先引入能够处理混合型数据的K—prototypes聚类算法,在此基础上构造了一种基于粒子群优化算法和K—prototypes方法的混合聚类算法.利用粒子群优化算法良好的全局搜索能力,克服K—prototypes容易陷入局部最优值的不足.实验结果表明,该算法能够避免陷入局部最优值,具有较好的全局收敛性,并且提高了聚类的正确率和算法的稳定性.  相似文献   

17.
针对化工过程灰箱建模存在的精确度差、速度慢、计算复杂度高等问题,对现行模糊C-均值聚类算法进行了改进,提出了一种快速全局优化的(用于建模的数据训练集)模糊聚类算法.该算法具有不依赖初始条件、收敛速度快等特点.实验结果表明,利用快速全局优化模糊聚类算法得到的数据,在灰色预测的时间和数据准确性方面都有了显著提高,计算机仿真实验表明了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号