首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
分析目前基于聚类思想的遗传算法的不足,提出一种基于生长树聚类的改进型遗传算法。采用最小生成树的聚类方法,能对形状复杂且非重叠样本的候选解进行聚类形成家族;新的族间交叉算子保持了种群的多样性;改进的族内交叉算子和改进的变异算子使得算法在后期仍能快速收敛;实验对经典算法测试函数进行优化,并与其他算法的优化结果对比,从而说明改进型遗传算法的性能。实验结果表明:基于生长树聚类的改进型遗传算法能有效提高求解精度,快速搜索到最优解。  相似文献   

2.
提出了一种基于网格生长树的微粒群聚类算法。算法利用网格和密度阈值去除数据集中的孤立点,从网格集中随机地选取种子点,以基于密度距离作为判断生长方向及分类的依据,以网格生长树的大小作为聚类目标函数。引入微粒群算法确定最终的聚类结果。测试表明,基于网格生长树的微粒群聚类算法对于大规模形状复杂非重叠的数据是可行且有效的。  相似文献   

3.
基于k-d树的k-means聚类方法   总被引:3,自引:2,他引:1  
在直接k-means算法的基础上提出了一种新的基于k-d树的聚类方法。通过把所有的对象组织在一棵k-d树中,可以高效地发现给定原型的所有最近邻对象。利用的主要思想是:在根结点,所有的聚类中心(或称为候选原型)都是所有对象的最近邻候选集合,对于根结点的子结点,通过简单几何约束来剪枝该候选集,这种方法可以被递归使用。使用基于k-d树的方法可以使直接k-means算法的总体性能提高一到两个数量级。  相似文献   

4.
厍向阳  彭文祥  薛惠锋 《计算机应用》2005,25(10):2395-2397
分析了目前满足二维空间邻接条件聚类算法的不足。从聚类概念出发,重新定义了满足二维空间邻接条件聚类的概念。面对满足二维空间邻接条件的聚类问题,定义了邻接矩阵的概念。以邻近距离和邻接矩阵为样本划分依据,以类内平方误差和(WGSS)为聚类目标函数,引入遗传算法,提出满足二维空间邻接条件的遗传聚类算法。通过实例进行了算法测试,并与模糊聚类(FCM)结果进行比较。  相似文献   

5.
聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。  相似文献   

6.
针对DBSCAN聚类算法随着数据量增大,耗时越发非常严重的问题,提出一种基于KD树改进的DBSCAN算法(以下简称KD-DBSCAN).通过KD树对数据集进行划分,构造邻域对象集,提前区分出噪声点和核心点,避免聚类过程中对噪声的邻域集计算以及加快了核心点对象的邻域集查询速度.文中以浮动车GPS数据为实验数据,对比传统D...  相似文献   

7.
离群点检测是数据挖掘一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法。对离群数据挖掘几类主要的方法进行了分析和评价,并在此基础上了提出了一种基于遗传聚类的离群点检测算法。该算法结合了遗传算法全局搜索的优点和K-均值方法局部收敛速度快的特点,取得较好效果。实验验证该算法很好地检测到数据集中的离群点,同时还完成了数据集的聚类。具有较好的实用性。  相似文献   

8.
周妍  孔晓玲  张然 《福建电脑》2007,(8):9-10,21
聚类分析是数据挖掘的核心技术之一。本文介绍了当前最具代表性的聚类算法,分析它们各方面的特性,总结了聚类方法发展的趋势,并对聚类算法的研究提出了展望,便于研究者对已有算法应用与改进。  相似文献   

9.
基于k-means聚类算法的研究   总被引:4,自引:0,他引:4  
分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法.通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高.通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义.  相似文献   

10.
基于树编辑距离的层次聚类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编码方法,提出了一种新的基于树编辑距离的层次聚类算法HCTED(Hi-erarchical Clustering Algorithm Based on Tree Edit Distance)。新算法通过树编辑操作使用最少的代价计算属性相似性,克服了传统聚类算法标称型计算的缺陷,提高了聚类精度,通过设定阈值对给定样本聚类。实验证明了新方法在身份识别上的准确性和有效性,讨论了不同参数对实验结果的影响,对比传统聚类算法,HCTED算法性能明显提高。新算法已经应用到警用流动人口分析中,取得了良好效果。  相似文献   

11.
模糊聚类的最大树算法在Web页面分类中的应用   总被引:5,自引:0,他引:5  
通过Web日志中记录的客户对Web页面的访问情况建立Web页面的用户访问矩阵,在此基础上构造模糊相似矩阵,根据模糊相似矩阵由最大树算法进行聚类。分析和算例表明,通过模糊相似矩阵进行聚类避免了构造模糊等价矩阵的大计算量,具有简单、快捷,适合处理高维数据的特点。  相似文献   

12.
引入遗传算法试图解决海量、高维样本的聚类问题。分析了目前基于样本和属性值两类基于遗传算法的聚类算法的不足,归纳出它们的算法模型。针对多维快速聚类问题提出了密度法、网格法两种基于遗传算法的聚类算法。算法测试表明,改进后的基于遗传算法的聚类方法能够解决海量、高维样本的聚类问题。  相似文献   

13.
聚类后的关联规则快速更新算法研究   总被引:1,自引:0,他引:1  
关联规则和聚类分析是数据挖掘中重要的研究课题。通过对关联规则挖掘算法Apriori算法进行分析与研究,指出了其在实用中存在的两个主要问题。鉴于此,在分析聚类分析和关联规则两种挖掘算法的基础上,讨论了将这两种独立的挖掘方法集成起来的联合挖掘,使其可以有效地压缩数据规模。给出了聚类后的关联规则快速更新算法描述。实验结果表明,算法性能优良,提高了数据挖掘执行效率。  相似文献   

14.
讨论入侵检测系统的基本技术,探讨基于智能技术的入侵检测方法,提出基于聚类算法的入侵检测系统。从实验结果来看,该入侵检测系统检测率高,误警率低,能有效满足用户的需求。  相似文献   

15.
基于遗传算法的K均值聚类分析   总被引:11,自引:0,他引:11  
1 前言聚类分析就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同的簇中的对象差别较大。聚类分析目前应用广泛,已经成为数据挖掘主要的研究领域。通过聚类,人们能够识别密集的和稀疏的区域,从而发现数据的整体分布模式,还能找到数据间的有趣的相互关系。关于聚类分析目前已经有K均值,CURE等很多算法,  相似文献   

16.
遗传算法技术浅论   总被引:1,自引:0,他引:1  
刘俊丽  韩旭 《电脑学习》2009,(5):142-142,F0003
本文讨论了遗传算法的原理、特点、应用、操作等知识。通过对遗传算法的构造步骤的描述.给出了遗传算法的实现过程。  相似文献   

17.
阐明决策树分类器在用于分类的数据挖掘技术中依然重要,论述基于决策树归纳分类的ID3、C4.5算法,并且对决策属性的选取法则进行说明。通过实例解析ID3、C4.5算法实现过程,结果表明C4.5算法相比较于ID3算法的优越性.尤其在处理具有多属性值的数据时的更加合理和正确。  相似文献   

18.
从数据挖掘的概念入手, 以数据结构的角度看待数据挖掘的研究对象, 对数据挖掘的重要工具——聚类做了深入的论述, 把聚类分为基于数据元素的Q 型聚类和基于属性的R 型聚类, 着重讨论了R 型聚类, 论述了相关的概念、技术和算法。最后介绍了一个实际应用系统———医生医疗质量评价系统, 提出了一些新的观点及算法设计思路。  相似文献   

19.
对Web挖掘进行了概述,分析了Web使用挖掘的关键问题,设计了一个基于遗传算法的KP混合聚类算法,并应用于Web使用挖掘的访问者模式识别处理。系统的实验结果表明,提出的算法和推荐策略在Web使用挖掘的处理过程中是科学的和有效的。  相似文献   

20.
数据挖掘中的聚类算法综述   总被引:30,自引:0,他引:30  
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术。全面总结了数据挖掘中聚类算法的研究现状,分析比较了它们的性能差异和各自存在的优点及问题,并结合多媒体领域的应用需求指出了其今后的发展趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号