首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
融合网格密度的聚类中心初始化方案   总被引:1,自引:0,他引:1  
提出了一种采用密度指针的聚类中心初始化方法——density pointer (DP) 算法。DP算法以网格单元的几何中心为对称中心,连接该中心与网格单元各顶点,以此对称分割传统的类矩形网格单元,形成超三角形子空间;进而根据各个超三角形子空间与邻居单元相邻的超三角形子空间的密度差异确定密度指针的方向,并根据密度指针计算出每个密集网格单元的聚集因子;最后将具有较大局部聚集因子的网格单元族的重心作为初始聚类中心。在公开数据集和人工数据集上的实验结果表明,DP算法能快速高效地找到接近于真实聚类中心的数据点作为初始聚类中心。针对算法的效率实验表明,DP算法的时间开销与数据集实例数、维度及网格单元数量均呈一阶线性关系。  相似文献   

2.
k-means聚类算法中,初始聚类中心的选取与数据中的离群点都对算法的结果有着非常大的影响。针对这一问题,提出一种基于网格和密度的k-means聚类算法GD-k-means,该算法首先将数据集映射到网格上形成网格簇进行初步聚类,利用密度阈值将网格分为低密度网格簇和高密度网格簇,在高密度网格簇中选取初始聚类中心,并利用传统的k-means算法进行迭代,通过评价条件判定是否需要进行网格簇的合并。聚类完成之后按照距离最近的原则对低密度网格簇中的数据进行相应的分配。实验结果表明:GD-k-means算法聚类结果更稳定,并且能够抵抗噪音数据的干扰。  相似文献   

3.
针对传统K-means算法初始中心选取的随机性导致算法聚类效果不佳的问题,提出一种基于网格密度距离的K-means算法,即GDD-K-means。该算法先把数据点放入网格空间内,以网格为单元进行数据处理,遍历网格得到网格密度,根据密度阈值筛选出高密度网格并进行降序排序;再在高密度网格中引入K-means++思想,选取k个距离较远的网格点;最后进行K-means算法聚类的k个初始中心点将确定在上述网格点中。仿真实验结果表明,GDD-K-means算法减少了聚类中心选取的随机性,改善了聚类的效果。  相似文献   

4.
聚类效果往往依赖于密度和相似度的定义,并且当数据的维增加时,其复杂度也随之增加。该文基于共享型最近邻居聚类算法SNN,提出了一种改进的共享型最近邻居聚类算法RSNN,并将RSNN应用于高速公路交通数据集上,解决了SNN算法在"去噪"、孤立点和代表点的判断、聚类效果等方面的不足之处。实验结果表明,RSNN算法比SNN算法在时空数据集上具有更好的聚类效果。  相似文献   

5.
传统的K-means算法是一种常用的聚类算法,但它对于初始聚类中心敏感,容易受到"噪声"和孤立点的影响,由此提出了一种基于网格的二次K-means聚类算法.此算法先将空间划分为多个大小相等的网格,然后根据给定的密度阈值来计算出密集网格,对密集网格中的点进行初次聚类,将初次聚类结果的均值点作为第二次聚类的初始均值点,从而消除了"噪声"和孤立点的影响,并且保证了信息的完整,实验证明此算法是有效的.  相似文献   

6.
随着信息技术的快速发展,能够获取人们大量的轨迹数据。通过轨迹数据挖掘出城市热点区域,对城市规划、交通管理和一些基于位置的服务都具有重要意义。针对已有的数据挖掘方法,如k均值聚类算法、基于密度的聚类(Density Based Spatia Clustering of Applications with Noise,DBSCAN)算法、谱聚类(Spectral Clustering,SC)算法、密度峰值聚类(Density Peak Clustering,DPC)算法等,存在非凸数据集上聚类效果较差,对初始中心敏感,参数选择困难,时间复杂度较高等问题,提出基于网格划分和DPC改进谱聚类算法用于城市热点区域分析。在合成数据集上的实验结果表明,其聚类精度和时间与经典聚类算法相比具有一定的提升。在西安市出租车数据集上的实验结果表明,提出的算法能有效挖掘出城市热点区域。  相似文献   

7.
为了提高网络行为聚类的准确性和有效性,提出了一种用于分析网络行为的改进K均值算法.算法首先计算K类中心的轮廓系数,以及各类数据与类中心的距离,然后自动选取优秀样本,最后求均值作为优化后的初始聚类中心重新进行聚类.在UCI数据集上的实验表明,该算法聚类时间短,提高了聚类的准确性.  相似文献   

8.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

9.
为使多路谱聚类方法对复杂结构数据集有效地聚类,根据矩阵扰动理论,利用局部近邻关系更新谱聚类算法(NJW)中的初始相似度矩阵,得到最终的亲和矩阵.理论分析表明,数据集可划分时,该矩阵是理想块矩阵或接近理想块矩阵,保证了本文算法聚类划分的正确性.将本文算法和基于路径的谱聚类、密度敏感的谱聚类以及基于流平面排序的谱聚类进行了比较,结果表明,本文算法在数据集具有复杂分布结构时可以确定聚类个数,得到正确的聚类结果.进一步将本文算法用于真实数据集上的聚类分析,表明本文算法是有效的.  相似文献   

10.
分析了数据流的特点,针对数据流聚类算法CluStream对数据流中非球形聚类效果不好的情况,提出了基于数据流的不规则网格增量聚类算法IIGStream.IIGStream算法具备了传统网格聚类算法处理速度快的优点.同时能够动态增量地调整网格结构.对新到来的数据点,通过判断网格是否相连,保证了对于不同形状聚类的聚类效果.IIGStream在聚类时无需预先指定聚类数目.且对孤立点不敏感.在真实数据集与仿真数据集上的实验结果表明,IIGStream算法具有良好的适用性和有效性,在聚类精度以及速度上均优于CluStream算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号