共查询到20条相似文献,搜索用时 78 毫秒
1.
分析目前基于聚类思想的遗传算法的不足,提出一种基于生长树聚类的改进型遗传算法。采用最小生成树的聚类方法,能对形状复杂且非重叠样本的候选解进行聚类形成家族;新的族间交叉算子保持了种群的多样性;改进的族内交叉算子和改进的变异算子使得算法在后期仍能快速收敛;实验对经典算法测试函数进行优化,并与其他算法的优化结果对比,从而说明改进型遗传算法的性能。实验结果表明:基于生长树聚类的改进型遗传算法能有效提高求解精度,快速搜索到最优解。 相似文献
2.
提出了一种基于网格生长树的微粒群聚类算法。算法利用网格和密度阈值去除数据集中的孤立点,从网格集中随机地选取种子点,以基于密度距离作为判断生长方向及分类的依据,以网格生长树的大小作为聚类目标函数。引入微粒群算法确定最终的聚类结果。测试表明,基于网格生长树的微粒群聚类算法对于大规模形状复杂非重叠的数据是可行且有效的。 相似文献
3.
基于k-d树的k-means聚类方法 总被引:3,自引:2,他引:1
在直接k-means算法的基础上提出了一种新的基于k-d树的聚类方法。通过把所有的对象组织在一棵k-d树中,可以高效地发现给定原型的所有最近邻对象。利用的主要思想是:在根结点,所有的聚类中心(或称为候选原型)都是所有对象的最近邻候选集合,对于根结点的子结点,通过简单几何约束来剪枝该候选集,这种方法可以被递归使用。使用基于k-d树的方法可以使直接k-means算法的总体性能提高一到两个数量级。 相似文献
4.
5.
刘凤芹 《计算机光盘软件与应用》2012,(21):60-61
聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。 相似文献
6.
针对DBSCAN聚类算法随着数据量增大,耗时越发非常严重的问题,提出一种基于KD树改进的DBSCAN算法(以下简称KD-DBSCAN).通过KD树对数据集进行划分,构造邻域对象集,提前区分出噪声点和核心点,避免聚类过程中对噪声的邻域集计算以及加快了核心点对象的邻域集查询速度.文中以浮动车GPS数据为实验数据,对比传统D... 相似文献
7.
离群点检测是数据挖掘一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法。对离群数据挖掘几类主要的方法进行了分析和评价,并在此基础上了提出了一种基于遗传聚类的离群点检测算法。该算法结合了遗传算法全局搜索的优点和K-均值方法局部收敛速度快的特点,取得较好效果。实验验证该算法很好地检测到数据集中的离群点,同时还完成了数据集的聚类。具有较好的实用性。 相似文献
8.
9.
基于k-means聚类算法的研究 总被引:4,自引:0,他引:4
分析研究聚类分析方法,对多种聚类分析算法进行分析比较,讨论各自的优点和不足,同时针对原k-means算法的聚类结果受随机选取初始聚类中心的影响较大的缺点,提出一种改进算法.通过将对数据集的多次采样,选取最终较优的初始聚类中心,使得改进后的算法受初始聚类中心选择的影响度大大降低;同时,在选取初始聚类中心后,对初值进行数据标准化处理,使聚类效果进一步提高.通过UCI数据集上的数据对新算法Hk-means进行检测,结果显示Hk-means算法比原始的k-means算法在聚类效果上有显著的提高,并对相关领域有借鉴意义. 相似文献
10.
为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编码方法,提出了一种新的基于树编辑距离的层次聚类算法HCTED(Hi-erarchical Clustering Algorithm Based on Tree Edit Distance)。新算法通过树编辑操作使用最少的代价计算属性相似性,克服了传统聚类算法标称型计算的缺陷,提高了聚类精度,通过设定阈值对给定样本聚类。实验证明了新方法在身份识别上的准确性和有效性,讨论了不同参数对实验结果的影响,对比传统聚类算法,HCTED算法性能明显提高。新算法已经应用到警用流动人口分析中,取得了良好效果。 相似文献
11.
12.
13.
14.
侯卫彪 《电脑与微电子技术》2010,(12):25-29
讨论入侵检测系统的基本技术,探讨基于智能技术的入侵检测方法,提出基于聚类算法的入侵检测系统。从实验结果来看,该入侵检测系统检测率高,误警率低,能有效满足用户的需求。 相似文献
15.
基于遗传算法的K均值聚类分析 总被引:11,自引:0,他引:11
1 前言聚类分析就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同的簇中的对象差别较大。聚类分析目前应用广泛,已经成为数据挖掘主要的研究领域。通过聚类,人们能够识别密集的和稀疏的区域,从而发现数据的整体分布模式,还能找到数据间的有趣的相互关系。关于聚类分析目前已经有K均值,CURE等很多算法, 相似文献
16.
17.
阐明决策树分类器在用于分类的数据挖掘技术中依然重要,论述基于决策树归纳分类的ID3、C4.5算法,并且对决策属性的选取法则进行说明。通过实例解析ID3、C4.5算法实现过程,结果表明C4.5算法相比较于ID3算法的优越性.尤其在处理具有多属性值的数据时的更加合理和正确。 相似文献
18.
19.
蒋腾旭 《数字社区&智能家居》2007,2(10):1078-1079
对Web挖掘进行了概述,分析了Web使用挖掘的关键问题,设计了一个基于遗传算法的KP混合聚类算法,并应用于Web使用挖掘的访问者模式识别处理。系统的实验结果表明,提出的算法和推荐策略在Web使用挖掘的处理过程中是科学的和有效的。 相似文献