首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
在现有的基于空间约束的空间聚类算法DBCluC和DBRS+等的研究和比较基础上,提出了一种新的处理物理约束的基于密度的空间聚类算法——DBCluC+。该算法在DBCluC算法基础上,采用网络拓扑结构建模通达对象,并增加通达对象访问点的宽度属性,从而采用约束距离(constrained distance)代替简单的欧几里德距离或障碍距离(obstacle distance)作为相异度的度量标准。理论分析和实验结果表明,DBCluC+算法不仅具有密度聚类算法的优点,而且聚类结果比传统的处理通达约束的聚类算法更  相似文献   

2.
一种处理障碍约束的聚类算法   总被引:1,自引:0,他引:1  
根据障碍约束空间聚类问题的特点,利用图论的相关知识,提出了一种分阶段的基于图的聚类的算法。首先,通过最小生成树聚类算法,在不考虑障碍约束的情况下对空间对象进行聚类;然后,引入障碍物对上一步的聚类结果进行分割;最后,根据被障碍物分割后形成的各个类之间的障碍距离,将距离较近的两个类合并,形成最终的聚类结果。最后通过实验验证了算法的效果,而且输入参数少,时间复杂度低。  相似文献   

3.
一种基于障碍约束的空间数据聚类方法   总被引:3,自引:1,他引:3  
聚类方法是空间数据挖掘的主要方法之一。针对聚类时障碍的约束,文章在用多边形有效地模拟约束条件和对多边形模型约简的基础上,提出了基于障碍约束的DBCluOC算法,并对算法进行了简要的分析。  相似文献   

4.
传统的聚类方法不能直接运用于分布空间内存在障碍物的数据的聚类.提出了一种障碍空间内基于密度的快速聚类算法DBCO来解决此类问题.DBCO中,在基于密度的聚类基础上引入了障碍模型,提出了一种保持数据间可见性的简化障碍的方法.为了使障碍模型不影响聚类质量,定义了障碍顶点距离、连接距离和判断距离来维持聚类的质量.另外,在聚类过程中,选择某一些代表点和拓展点而不是每一个点来对每一个聚类进行扩展,从而大大提高了聚类算法的效率.实验结果表明了DB-CO算法可以快速地得到高质量的聚类结果.  相似文献   

5.
聚类方法是空间数据挖掘的重要方法之一。本文针对聚类时障碍的约束,提出了一种基于障碍约束的空间聚类算法———DBCluOC(Density-BasedCluster-ingwithObstaclesConstraints)。文章首先介绍了基于密度的聚类算法DBSCAN(Density-BasedSpatialClusteringofApplicationwithNoise)以及直接密度可达、密度相连、簇等概念。然后介绍了对约束条件模拟和对多边形约简的方法,并在此基础上提出了DBCluOC算法。最后对算法进行了分析,描述了算法的执行情况。该算法虽然是在二维空间下实现的,但在综合考虑其他因素的前提下,可以推广到对高维…  相似文献   

6.
传统的空间聚类算法解决的是未带障碍约束的空间数据聚类问题,而现实的地理空间中经常会存在河流、山脉等阻碍物,因此,传统空间聚类算法不适用于带障碍数据约束的现实空间.在解析了带障碍空间聚类相关概念和定义的前提下,对带障碍约束条件的空间聚类算法进行梳理,给出了这类算法的研究历史和沿袭关系,并把这类算法按七个维度分为四大类,分析了每类的技术优缺点,最后给出了带障碍约束的空间聚类算法的未来研究趋向.  相似文献   

7.
空间实体的存在会对空间聚类结果产生重要的影响。传统的空间聚类算法通常没有考虑空间实体的约束作用,很难保证聚类结果的真实性。针对空间约束中的障碍约束和便利约束,本文提出了一种改进的基于空间拓扑相邻关系的密度聚类算法CD—DBSCAN。该算法充分利用空间对象间的拓扑相邻关系,既考虑了空间障碍的阻隔作用,又兼顾了空间便利的连通作用。聚类结果研究表明,该算法能够有效地挖掘出约束条件下的数据集的聚集特征。  相似文献   

8.
为了有效解决障碍空间中的不确定数据聚类的问题,引入计算几何中的Voronoi图对数据空间进行划分,提出障碍空间中基于Voronoi图的不确定数据聚类算法.根据Voronoi图的性质,提出4项聚类规则.利用KL距离进行相似性度量.根据障碍集合是否发生变化,提出了静态障碍环境下和动态障碍环境下的不确定数据聚类算法.理论研究和实验表明:静态障碍物环境中的不确定精炼聚类算法(简称STAO_RVUBSCAN算法)、障碍物动态增加情况下的不确定聚类算法(简称DYNOC_VUBSCAN算法)、障碍物动态减少情况下的不确定聚类算法(简称DYNOR_VUBSCAN算法)和障碍物动态移动情况下的不确定数据聚类算法(简称DYNOM_VUBSCAN算法)都具有较高的效率.  相似文献   

9.
粒子群K-Medoids带障碍约束空间聚类分析研究   总被引:1,自引:0,他引:1  
空间聚类分析是空间数据挖掘研究领域中的一个重要研究课题.传统聚类算法忽略了真实世界中许多约束条件的存在,而约束条件的存在会影响聚类结果的合理性.本文在分析粒子群优化算法和划分算法的基础上,研究一种基于粒子群和划分相结合的带障碍约束空间聚类分析方法,设计了一个粒子群K-Medoids带障碍约束空间聚类分析算法.对比实验表明,该方法不仅兼顾了局部收敛和全局收敛性能,又充分考虑到了现实障碍物对聚类结果的影响,使得聚类结果更具实际意义.与遗传K-Medoids带障碍约束空间聚类分析相比,该方法具有更好的可伸缩性,且所需输入的参数相对较少,更适合于对聚类速度要求较高的动态约束条件场合.  相似文献   

10.
带障碍约束的遗传K中心空间聚类分析   总被引:1,自引:0,他引:1       下载免费PDF全文
空间聚类分析是空间数据挖掘中的一个重要研究课题。传统聚类算法忽略了真实世界中许多约束条件的存在,而约束条件的存在会影响聚类结果的合理性。讨论了带障碍约束的空间聚类问题,研究了一种基于遗传和划分相结合的带障碍约束空间数据聚类分析方法,设计了一个带障碍约束的遗传K中心空间聚类分析算法。对比实验表明,该方法兼顾了局部收敛和全局收敛性能,考虑到了现实障碍物对聚类结果的影响,使得聚类结果更具有实际意义,其结果优于传统K中心聚类及单纯的遗传聚类,不足之处是其计算速度相对较慢。  相似文献   

11.
In this paper, we offer a method aiming to minimize the role of distance metric used in clustering. It is well known that distance metrics used in clustering algorithms heavily influence the end results and also make the algorithms sensitive to imbalanced attribute/feature scales. To solve these problems, a new clustering algorithm using a per-attribute/feature ranking operating mechanism is proposed in this paper. Ranking is a rarely used discrete, nonlinear operator by other clustering algorithms. However, it also has unique advantages over the dominantly used continuous operators. The proposed algorithm is based on the ranks of the data samples in terms of their spatial separation and is able to provide a more objective clustering result compared with the alternative approaches. Numerical examples on benchmark datasets prove the validity and effectiveness of the proposed concept and principles.  相似文献   

12.
以网格化数据集来减少聚类过程中的计算复杂度,提出一种基于密度和网格的簇心可确定聚类算法.首先网格化数据集空间,以落在单位网格对象里的数据点数表示该网格对象的密度值,以该网格到更高密度网格对象的最近距离作为该网格的距离值;然后根据簇心网格对象同时拥有较高的密度和较大的距离值的特征,确定簇心网格对象,再通过一种基于密度的划分方式完成聚类;最后,在多个数据集上对所提出算法与一些现有聚类算法进行聚类准确性与执行时间的对比实验,验证了所提出算法具有较高的聚类准确性和较快的执行速度.  相似文献   

13.
带障碍的聚类问题是一个具有实际应用价值的问题,因为现实世界中确实存在河流、山脉等之类的物理障碍,这们的存在会影响聚类结果的合理性。传统的聚类算法在进行空间数据的聚类时,往往忽略了障碍对于聚类结果的影响。本文讨论了不同障碍对数据点间连通性的不同影响,提出了带障碍的分级聚类算法OBHIEC。分级聚类方法使得需要计算障碍距离的点对数目减少,并能处理数据分布密度不同的情况。实验结果表明,OBHIEC算法能有效完成带障碍的聚类,并具有较好的增量特性。  相似文献   

14.
针对基于密度的传统算法不能处理混合属性数据,以及目前的混合属性聚类算法大多数聚类质量不高等问题,提出了基于密度和混合距离度量方法的混合属性聚类算法.该算法通过分析混合属性数据特征,将混合属性数据分为数值占优、分类占优和均衡型混合属性数据3类,分析不同情况的特征选取相应的距离度量方式,通过预设参数能够发现数据密集区域,确定核心点,再利用核心点确定密度相连的对象实现聚类,获得最终的聚类结果.将算法应用于多种数据集上的实验结果表明,该算法具有较高的聚类质量,能够有效处理混合属性数据.  相似文献   

15.
便利体和障碍物下基于网格的空间聚类算法   总被引:1,自引:1,他引:0  
为了降低计算代价,在CLIQUE算法的基础上引入了便利网格和障碍网格等概念,提出了便利体和障碍物下基于网格的聚类算法(GBSCFO)。GBSCFO首先利用CLIQUE算法生成微簇,然后在微簇的粒度上计算障碍距离。通过理论分析和实验验证,GBSCFO具有较好的时间复杂度和聚类效果。  相似文献   

16.
在现有的算法DBSCAN基础上,提出一种基于密度的处理购物篮事务数据的聚类方法-DCMBD(density-based clustering for market basketdata)。使用了一种新的事务表示法,解决了购物篮数据的高维性和稀疏性问题。并对算法进行了相应的改进,从而提高了聚类速度。实验结果表明此方法是有效可行的。  相似文献   

17.
CFSFDP算法(Clustering by Fast Search and Find of Density Peaks)具有简单高效且需要较少参数的优点,但存在需要人为确定截断距离参数和聚类中心的不足。为克服以上不足,提出了自适应快速搜索密度峰值聚类算法。该算法针对截断距离参数的确定问题,构造关于截断距离参数的局部密度信息熵,通过最小化信息熵自适应地确定截断距离参数;针对聚类中心的确定问题,利用从非聚类中心到聚类中心数据点局部密度和距离的乘积,存在明显跳跃这一特征确定阈值,从而能自动确定聚类中心。实验结果表明该算法能够取得较好的聚类性能,且无需人为确定截断距离参数和聚类中心。  相似文献   

18.
近年来,谱聚类在分类领域得到了广泛的研究,其中基于路径和基于密度的算法是两个重要的研究方向。虽然这两种算法在一些数据集上能取得较好的分类效果,但不能对一些特殊的数据集进行准确分类。融合了这两种方法的优点,通过多级密度约束来寻找路径,根据得到的路径建立新的相似性矩阵。为了加强对噪声的鲁棒性,根据数据集的局部信息加入鲁棒性系数,提出了基于路径与密度的稳健谱聚类算法。实验结果表明该方法在人工数据集和手写体数据集上能取得较理想的分类结果。  相似文献   

19.
吴玲玉  白尘 《计算机应用研究》2013,30(11):3283-3286
传统属性空间的密度聚类算法仅考虑对象属性取值相似度, 网络空间密度聚类算法仅关注对象间关系紧密度。针对两类算法的不足, 提出一种兼顾属性距离及关系强度的密度聚类算法。在构建兼顾属性距离及关系强度的网络之后, 完善了近邻对象及核心对象的概念, 并给出了相应的聚类策略。理论分析和实验结果表明, 由于综合考虑了属性、关系及关系强度信息, 算法规避了对象属性值分布对聚类过程的影响, 改善了聚类效果, 并能有效识别枢纽点和孤立点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号