首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 921 毫秒

1.  基于密度和层次的快速聚类算法在数据挖掘中的设计及实现  
   张艳《信息安全与技术》,2013年第4卷第8期
   本论文在对各种算法深入分析的基础上,尤其在对基于密度的聚类算法he基于层次的聚类算法深入研究的基础上,提出了一种全新的基于密度和层次的快速聚类算法。该算法保持了基于密度聚类算法发现任意形状簇的优点,而且具有近似线性的时间复杂性,因此该算法适合对大规模数据的挖掘。理论分析和实验结果也证明了基于密度和层次的聚类算法具有处理任意形状簇的聚类、对噪音数据不敏感的特点,并且其执行效率明显高于传统的DBSCAN算法。    

2.  SUDBC:一种基于空间单元密度的快速聚类算法  被引次数:3
   刘晓影  王国仁《小型微型计算机系统》,2005年第26卷第12期
   随着数据规模越来越大,要求聚类算法有很高的执行效率,很好的扩展性,能发现任意形状的聚类以及对噪音数据的不敏感性.提出了一种基于空间单元密度的快速聚类算法SUDBC,该算法首先将被聚类的数据划分成若干个空间单元,然后基于空间单元密度将密度超过给定阈值的邻居单元合并为一个类.实验结果验证了SUDBC算法具有处理任意形状的数据和对噪音数据不敏感的特点.    

3.  一种改进的基于密度的聚类算法  被引次数:9
   陈燕 耿国华 郑建国《微机发展》,2005年第15卷第3期
   基于密度的聚类是聚类算法中的一种,其主要优点是可以发现任意形状的簇,对噪声不敏感。而现有的该类算法对于空间数据分布不均匀的情况聚类效果不佳。鉴于此,文中提出一种改进的基于密度的聚类算法,保持了基于密度的聚类算法的优点,并且可以有效地处理分布不均的数据集,减少了时间复杂度,适用于对大规模数据库的挖掘与分析。    

4.  一种改进的基于密度的聚类算法  
   陈燕  耿国华  郑建国《计算机技术与发展》,2005年第15卷第3期
   基于密度的聚类是聚类算法中的一种,其主要优点是可以发现任意形状的簇,对噪声不敏感.而现有的该类算法对于空间数据分布不均匀的情况聚类效果不佳.鉴于此,文中提出一种改进的基于密度的聚类算法,保持了基于密度的聚类算法的优点,并且可以有效地处理分布不均的数据集,减少了时间复杂度,适用于对大规模数据库的挖掘与分析.    

5.  聚类算法综述  
   伍育红《计算机科学》,2015年第42卷第Z6期
   数据挖掘技术可以从大量数据中发现潜在的、有价值的知识,它给人们在信息时代所积累的海量数据赋予了新的意义。随着数据挖掘技术的迅速发展,作为其重要的组成部分,网格聚类技术已经被广泛应用于数据分析、图像处理、市场研究等许多领域。网格聚类算法研究已经成为数据挖掘研究领域中非常活跃的一个研究课题。 介绍了数据挖掘理论,对网格聚类算法进行了深入的分析研究。在研究了传统网格聚类算法的基础上,提出了一些改进的网格聚类算法,这些算法相比传统网格聚类算法有更好的聚类质量和效率。在分析了传统的多密度聚类算法的基础上,提出了基于网格的多密度聚类算法(Grid-based Clustering Algorithm for Multi-density)[1],该算法主要采用密度阈值递减的多阶段聚类技术提取不同密度的聚类,同时对聚类结果进行了人工干预。研究结果表明,基于网格的多密度聚类算法不仅能够对数据集进行正确的聚类,同时还能有效地弥补孤立点检测,有效地解决了传统多密度聚类算法不能有效识别孤立点和噪声的缺陷。基于网格的多密度聚类算法比传统的共享近邻SNN算法精度高,适合于均匀密度数据集、大部分多密度数据集,并且可以发现任意形状的聚类,对噪声数据和数据输入顺序不敏感,但对小部分多密度数据集的聚类结果不理想[1]。    

6.  一种混合聚类算法及其应用  
   胡瑞飞  殷国富  谭颖《四川大学学报(工程科学版)》,2006年第38卷第5期
   通过分析基于网格与基于密度的聚类算法特征,提出了一种基于网格和密度的混合聚类算法,通过分阶段聚类并选取代表单元中的种子对象来扩展类, 从而减少区域查询次数,实现快速聚类。该算法保持了基于密度的聚类算法可以发现任意形状的聚类和对噪声数据不敏感的优点,同时保持了基于网格的聚类算法的高效性,适合对大规模数据的挖掘。实验数据分析验证了算法的有效性,对数据挖掘应用于设备状态监测和故障诊断具有指导意义。    

7.  基于密度的最小生成树聚类算法研究  被引次数:2
   崔光照  曹玲芝  张勋才  王延峰《计算机工程与应用》,2006年第42卷第5期
   基于密度的方法是一种相当有效的聚类方法,能够发现任意形状的聚类,对噪声数据不敏感,但是聚类结果严重依赖于用户参数的合理选择。针对其存在的问题,将最小生成树理论与基于密度的方法相结合,提出了一种基于密度的最小生成树聚类算法。通过构造、分割最小生成树得到确定样本空间划分的最小生成子树;根据子树特性,产生局部密度参数;并对生成子树进行局部密度聚类。理论分析和应用结果表明。该算法不仅体现了基于密度聚类方法的优点,聚类结果不依赖于用户参数的选择,使数据聚类更合理,特别是对大型数据库非常有效;也体现了数据分区的思想,使其可以并行执行,进一步提高了信息处理的时空效率和性能。    

8.  基于密度的空间聚类算法研究  
   NIE Yue-guang  CHEN Li-chao  CHEN Hu《微机发展》,2008年第8期
   基于密度的聚类算法作为数据挖掘方法中的一种主要方法,不仅可以从数据集中发现任意形状的簇,而且可以观察到一个并发的、完整的聚类结构,以及具有对噪声数据不敏感的特点。针对目前常用的几种基于密度的聚类算法及改进算法进行讨论,分析了这些密度聚类算法各自的优缺点,并且以地理信息系统为应用研究背景,提出了基于密度的聚类算法与GIS相结合,通过对多维数据属性特征的提取,扩展到多维数据的处理,在三维空间地形数据中的分析中取得了高效的聚类结果。    

9.  基于密度的空间聚类算法研究  被引次数:4
   聂跃光  陈立潮  陈湖《计算机技术与发展》,2008年第18卷第8期
   基于密度的聚类算法作为数据挖掘方法中的一种主要方法,不仅可以从数据集中发现任意形状的簇,而且可以观察到一个并发的、完整的聚类结构,以及具有对噪声数据不敏感的特点.针对目前常用的几种基于密度的聚类算法及改进算法进行讨论,分析了这些密度聚类算法各自的优缺点,并且以地理信息系统为应用研究背景,提出了基于密度的聚类算法与GIS相结合,通过对多维数据属性特征的提取,扩展到多维数据的处理,在三维空间地形数据中的分析中取得了高效的聚类结果.    

10.  密度蚂蚁思想的K-Means算法的研究  
   何健  张聪《制造业自动化》,2012年第34卷第4期
   遗传算法具有快速良好的全局搜索能力,而蚁群聚类算法具有良好的分布式并行性和正反馈能力.K-Means、基于密度的聚类是常见的基于分割的聚类方法,它在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点.聚类算法概述聚类分析是数据挖掘领域中的一项重要的研究课题,本文主要研究是将遗传算法,蚂蚁算法、K-Means算法、密度思想结合在一起,提出了一种基于密度蚂蚁思想的K-Means算法,采用密度函数法的多中心聚类并结合小类合并运算的聚类结果明显优于K-means的聚类结果,提高了聚类的质量.再结合密度思想,使蚂蚁有选择地遍历,提高了算法效率,并克服了基于密度的算法不能发现任意形状聚类的问题.    

11.  基于图形轮廓的快速聚类算法  
   陈黎飞  姜青山  Wang Shengrui  董槐林《计算机研究与发展》,2006年第43卷第Z3期
   聚类是数据挖掘中的一项重要课题.在大型数据集中有效地发现具有任意形状、密度和尺度的簇结构是目前聚类算法研究中的一个开放性的问题.基于图形轮廓的思想,提出了一种快速的聚类算法PROFCLUS,使用数据点在图形空间分布形成的图形进行聚类,可以描述和发现任意类型的簇结构;聚类过程只扫描一遍数据集,通过渐进地构造图形映像的轮廓,使用少量的轮廓点信息进行增量的聚类,其时间复杂度接近于线性.实验验证表明,PROFCLUS可以对簇密度差异较大的数据进行有效聚类和噪声数据点识别;同时,与其他基于密度的算法相比,PROFCLUS大幅度提高了聚类效率.    

12.  基于数据分区的DBSCAN算法  被引次数:32
   周水庚  周傲英  曹晶《计算机研究与发展》,2000年第37卷第10期
   数据聚类在数据挖掘、模式识别、图像处理和数据压缩等领域有着广泛的应用。DBSCAN是一种基于密度的空间聚类算法,在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点,但由于直接对数据库进行操作,在数据量大的时间就需要较多的内存和I/O开销;此外,当数据密度和聚类间的距离不均匀时聚类质量较差,为此,在分析DBSCAN算法不足的基础上,提出了一个基于数据分区的DBSCAN算法,测试结果表    

13.  基于密度可达的多密度聚类算法  被引次数:1
   薛丽香  邱保志《计算机工程》,2009年第35卷第17期
   为对多密度数据集聚类,提出一种基于密度可达的多密度聚类算法。使用网格划分技术来提高计算每个点密度值的效率,每次聚类都是从最高密度点开始,根据密度可达的概念和广度优先的策略逐步向外扩展进行聚类。实验表明,该算法能够有效地对任意形状、大小的均匀数据集和多密度数据集进行聚类,并能较好地识别出孤立点和噪声,其精度和效率优于SNN算法。    

14.  基于网格的共享近邻聚类算法  被引次数:1
   刘敏娟  柴玉梅《计算机应用》,2006年第26卷第7期
   提出了一种基于网格的共享近邻聚类算法(Grid based shared Nearest Neighbor algorithm, GNN)。该算法主要利用网格技术去除数据集中的部分孤立点或噪声,使用密度阈值处理技术来处理网格的密度阈值,使用中心点技术提高聚类效率。GNN算法仅对数据集进行一遍扫描,且能处理任意形状和大小的聚类。实验表明,GNN有较好的可扩展性,其精度和效率明显地好于共享近邻SNN算法。    

15.  基于密度与动态阈值的任意形状聚类挖掘算法研究  
   陈沛帅  琚春华《电信科学》,2012年第28卷第1期
   本文分析了数据聚类算法BIRCH的不足之处,提出了一种基于密度与动态阈值的任意形状聚类挖掘算法——DVTD算法,它结合密度和阈值双重参数,并根据数据集内在特征,动态改变阈值T,既可以控制CF树的大小,也能利用不同球形聚类逼近任意形状的数据聚类.实验结果表明,它的算法复杂度与BIRCH相当,并大大降低了CF的大小,对任意形状的聚类效果可以达到与DBSCAN相近的效果.    

16.  基于视觉原理的密度聚类算法  被引次数:3
   王伟东  芦金婵  张讲社《工程数学学报》,2005年第22卷第2期
   在模式识别、图像处理、聚类分析等领域,人的眼睛具有快速有效地组织并发现物体内部结构的自然能力,本文就是在模拟人类视觉系统这一功能的基础上,结合基于密度的聚类方法提出了一种新的聚类算法,该算法具有对初始化参数不敏感、能发现任意形状的聚类及能找到最优聚类等优点。    

17.  基于相对密度的聚类算法  被引次数:5
   刘青宝 邓苏 张维明《计算机科学》,2007年第34卷第2期
   基于密度的聚类算法因其抗噪声能力强和能发现任意形状的簇等优点,在聚类分析中被广泛采用,本文提出的基于相对密度的聚类算法,在继承上述优点的基础上。有效地解决了基于密度的聚类结果对参数值过于敏感、参数值难以设置以及高密度簇完全被相连的低密度簇所包含等问题。    

18.  一种基于网格密度的自适应聚类分析算法*  
   董琰  葛君伟《计算机应用研究》,2007年第24卷第8期
   在结合基于密度和基于网格的聚类算法优点的基础上,提出一种新的聚类算法.该算法能够在海量、高纬数据下发现任意形状的聚类并对噪声数据不敏感,具有较低的时间和空间复杂性及较高的识别率.通过实验对该算法进行了性能比较和测试,显示了它在各方面的优越性.    

19.  基于模糊聚类的文本挖掘算法  被引次数:8
   刘志勇  耿新青《计算机工程》,2009年第35卷第5期
   针对传统FCM算法对孤立点比较敏感,须预先指定聚类数目的缺陷,提出一种新的模糊聚类算法NSFCM,将其应用干文本挖掘中。NSFCM对数据对象的隶属度增加一个权值,以减少孤立点对聚类中心的影响。采用平均信息熵确定聚类数,通过密度函数获得初始聚类中心。仿真结果证明,该算法聚类的精度和执行效率均高于FCM算法,效果较好。    

20.  一种对二维空间对象进行聚类的算法  
   滕明贵  熊范纶  吴正龙《模式识别与人工智能》,2005年第18卷第3期
   地理信息系统存储了大量的二维空间对象,对这些对象进行聚类分析是数据挖掘的一项重要任务.本文提出一种针对二维空间对象的聚类算法.该算法引用层次聚类方法的思想,将子聚类信息用一个聚类特征表示.采用基于密度的方法,发现任意形状的簇,能较好地处理孤立点,并且支持增量式聚类.实验证明该算法是有效的.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号