首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 718 毫秒
1.
基于密度的空间聚类算法研究   总被引:4,自引:1,他引:3  
基于密度的聚类算法作为数据挖掘方法中的一种主要方法,不仅可以从数据集中发现任意形状的簇,而且可以观察到一个并发的、完整的聚类结构,以及具有对噪声数据不敏感的特点.针对目前常用的几种基于密度的聚类算法及改进算法进行讨论,分析了这些密度聚类算法各自的优缺点,并且以地理信息系统为应用研究背景,提出了基于密度的聚类算法与GIS相结合,通过对多维数据属性特征的提取,扩展到多维数据的处理,在三维空间地形数据中的分析中取得了高效的聚类结果.  相似文献   

2.
一种改进的基于密度的聚类算法   总被引:1,自引:0,他引:1  
基于密度的聚类是聚类算法中的一种,其主要优点是可以发现任意形状的簇,但处理大数据集时效果不佳,为此提出了一种改进的算法M-DBSCAN,保留了基于密度聚类算法的优点,同时克服了以往算法不能处理大数据集的缺点。实验结果证明,M-DBSCAN聚类算法在聚类质量及速度上都比原DBSCAN有较大提高。  相似文献   

3.
传统的数据聚类处理主要采用基于聚类中心的方式,但其存在一些限制,例如需要预先确定聚类中心的数量,并对数据的分布形态有一定的要求。针对这一问题,本论文选择基于密度聚类算法作为解决方案,重点研究了电力设备位置信息的聚类问题。在介绍密度聚类原理和常用算法的基础上,分析了电力设备位置信息的特点和处理方法,介绍了OPTICS、HDBSCAN和DBSCAN三种密度聚类算法的实现步骤,并与传统的K-mean聚类算法进行比较,通过实验设计和结果分析,验证了密度聚类方法的有效性和适用性。最后,通过应用案例分析,探讨了这些方法在电力系统分析中的应用实例和价值。研究结果表明,基于密度聚类算法的电力设备位置信息聚类方法可以有效地帮助电力系统实现数据的快速分析,具有重要的理论和应用价值。  相似文献   

4.
一种改进的基于密度的聚类算法   总被引:10,自引:0,他引:10  
基于密度的聚类是聚类算法中的一种,其主要优点是可以发现任意形状的簇,对噪声不敏感。而现有的该类算法对于空间数据分布不均匀的情况聚类效果不佳。鉴于此,文中提出一种改进的基于密度的聚类算法,保持了基于密度的聚类算法的优点,并且可以有效地处理分布不均的数据集,减少了时间复杂度,适用于对大规模数据库的挖掘与分析。  相似文献   

5.
基于k均值分区的流数据高效密度聚类算法   总被引:2,自引:0,他引:2  
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的.  相似文献   

6.
基于密度的聚类是聚类算法中的一种,其主要优点是可以发现任意形状的簇,对噪声不敏感.而现有的该类算法对于空间数据分布不均匀的情况聚类效果不佳.鉴于此,文中提出一种改进的基于密度的聚类算法,保持了基于密度的聚类算法的优点,并且可以有效地处理分布不均的数据集,减少了时间复杂度,适用于对大规模数据库的挖掘与分析.  相似文献   

7.
移动边缘计算(mobile edge computing,MEC)环境下,海量的领域服务分布在边缘服务器上,如何对大规模的边缘服务进行精确的聚类是亟需解决的重要问题之一。为此提出了一种MEC环境下多维属性感知的边缘服务二次聚类方法。该方法首先分析并建立了MEC环境下边缘服务二次聚类指标模型。之后,提出了一种基于密度的最小生成树启发式分段聚类算法(heuristic segmented for MST clustering based on service density,DMSC),基于DMSC算法依据一级指标对边缘服务进行一次聚类;最后,将密度峰值算法中γ值引入到层次聚类中,构建了基于密度峰值的层次聚类算法(hierarchical clustering based on density peak,HCDP),基于HCDP算法依据二级聚类指标,在一次聚类的基础上对边缘服务进行二次聚类。在人工数据集和UCI数据集上开展了大量验证实验。实验结果表明,DMSC算法与HCDP算法提高了聚类的准确率,减少了算法的平均迭代次数,增强了算法的稳定性。  相似文献   

8.
在分析了现有的基于密度的聚类算法的基础上,结合微粒群算法,提出了一种基于密度的微粒群混合聚类算法。相对于DENCLUE聚类算法,该算法能够对使用的资源进行有效的控制,有利于实现对数据库数据的增量处理。实验证明了算法的有效性。  相似文献   

9.
引入遗传算法试图解决海量、高维样本的聚类问题。分析了目前基于样本和属性值两类基于遗传算法的聚类算法的不足,归纳出它们的算法模型。针对多维快速聚类问题提出了密度法、网格法两种基于遗传算法的聚类算法。算法测试表明,改进后的基于遗传算法的聚类方法能够解决海量、高维样本的聚类问题。  相似文献   

10.
数据流的网格密度聚类算法   总被引:3,自引:0,他引:3  
提出一种基于密度的实时数据流聚类算法RTCS.算法采用在线/离线双层框架,它在前台在线层快速实时地将到达的数据点放入相应的单元格,对多维数据和空间单元格动态计算密度.在后台离线层形成初始聚类,并不断地更新单元格的密度来自适应地调整聚类.RTCS算法能够根据密度的动态变化区分出真正的孤立点并剔除之,而这种剔除对后面的聚类结果没有影响.实验结果证明,算法可以很好地挖掘出各种形状的聚类,与CluStream算法相比,取得聚类的质量更高,有更快的处理速度,对数据维数和规模有更好的可扩展性.  相似文献   

11.
空间聚类是GIS空间分析的主要内容之一,传统矢量空间聚类算法存在数据冗余、结果不直观等弊端,介绍了基于栅格数据的空间聚类,并且针对现下主流的网格和密度方法的聚类算法存在效率和质量问题,提出了与栅格相结合的聚类挖掘算法,以期得到时间效率和聚类质量上的提高。  相似文献   

12.
基于数据场的改进DBSCAN聚类算法   总被引:1,自引:0,他引:1  
DBSCAN(density based spatial clustering of applications with noise)算法是一种典型的基于密度的聚类算法。该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具有正确类簇个数的聚类结果,也可能将部分数据错分为噪声。为此,利用数据场能较好描述数据分布,反映数据关系的优势,提出了一种基于数据场的改进DBSCAN聚类算法。该算法引入平均势差的概念,在聚类过程中动态地确定每个类的Eps和平均势差,从而能够在一些密度相差较大的数据集上得到较好的聚类结果。实验表明,所提算法的性能优于DBSCAN算法。  相似文献   

13.
聚类算法分析及在GIS中心选址中的仿真研究   总被引:1,自引:1,他引:0  
通过对聚类算法初始点选择策略的分析和比较,经典k-means算法在GIS海量数据处理上的效率问题,提出了随机采样的k-means算法来进行坐标聚类;并将随机采样k-means算法应用于GIS中心选址,充分利用GIS数据分析和处理能力,以城市间的欧几里得距离为相似条件,采用最大最小原则选取初始点进行聚类,从而缓解局部最优解产生的概率;选取中心城市作为目标对象,从而提高商业决策的充分性和可靠性;经仿真结果验证了所提出的随机取样k-means算法的有效性和正确率。  相似文献   

14.
提出的基于相对密度的数据流模糊聚类算法结合了相对密度聚类和模糊聚类的优点,能形成任意形状、多密度分辨率的层次聚类结果.同时,利用微簇空间位置重叠关系,定义了微簇集合间的差运算,从而有效地支持了用户指定时间窗口内的数据流聚类要求.通过与CluStream算法在聚类质量和处理时间两个方面的比较分析,发现基于相对密度的数据流模糊聚类算法具有明显的优势.  相似文献   

15.
为了解决传统聚类方法在多维数据集中聚类效果不佳的问题,提出了将网络社团划分的方法,并应用到多维数据聚类分析中。对于一个多维数据集,首先对分析对象进行特征提取,构建出每个对象的特征向量,通过计算皮尔森相关系数来度量不同特征向量之间的相似性,从而构建出一个相似性网络,采用Blondel算法对该网络进行社团划分达到聚类的效果。实验结果表明该方法可以在多维数据聚类中得到较好的聚类结果,准确率达到92.5%,优于K-means算法的75%。  相似文献   

16.
基于GIS的空间聚类算法研究   总被引:1,自引:1,他引:0  
面对目前的聚类方法的局限性和空间聚类的特殊性,从基于目标函数聚类的概念出发,以GIS的空间数据管理和空间分析为技术支持,探讨了空间样本间直接可达距离、间接可达距离和可达成本的计算方法。随机选择k个样本作为聚类中心点,以空间样本到各聚类中心点的可达距离为样本划分依据,以空间样本到其聚类中心点的可达成本的总和为聚类目标函数,引入遗传算法,提出一种基于GIS的空间聚类算法。最后,通过实例进行了算法测试。  相似文献   

17.
SUDBC:一种基于空间单元密度的快速聚类算法   总被引:3,自引:0,他引:3  
随着数据规模越来越大,要求聚类算法有很高的执行效率,很好的扩展性,能发现任意形状的聚类以及对噪音数据的不敏感性.提出了一种基于空间单元密度的快速聚类算法SUDBC,该算法首先将被聚类的数据划分成若干个空间单元,然后基于空间单元密度将密度超过给定阈值的邻居单元合并为一个类.实验结果验证了SUDBC算法具有处理任意形状的数据和对噪音数据不敏感的特点.  相似文献   

18.
针对层次聚类方法与K-Means聚类方法的一些不足,提出了一种基于密度偏差抽样的改进聚类分析算法DS-Ward,该算法能够自动获得中心点和聚类数,能够在计算量减少的情况下得到较为可靠的结果。通过基于该方法的卖方信用聚类分析模型对实际数据进行分析,以发现不同类别卖方的销售信用特点。  相似文献   

19.
在大数据量的环境下,传统空间数据的空间关系仅描述两个空间物体,从而出现数据存储冗余,检索速度慢等问题。提出改进的聚类算法对空间物体聚类,再在聚类结果的基础上表示空间物体的方向关系。提出了基于密度的K-均值算法和空间聚类与方向关系融合的新方法。所提方法增强了空间数据库对空间数据对象的空间方向关系的智能处理能力,节省了存储空间,提高了数据的查询速度。  相似文献   

20.
基于密度的聚类算法是聚类分析算法中的一种主要技术,它对空间数据库聚类有着很好的性能,然而,对大规模数据库聚类时,DBSCAN算法需要大量的内存支持并伴随着I/O开销.提出了一种带有矢量性的密度聚类算法,具有约束聚类方向,减少候选点的特点.以地理信息系统(GIS)为应用背景,成功应用于高速公路选线,得到了良好的效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号