共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
魏丽 《数字社区&智能家居》2007,(11):637-639
聚类分析技术是数据挖据中的一种重要技术。本文介绍了数据挖掘对聚类的典型要求和聚类方法的分类,研究分析了聚类的主要算法.并从多个方面对这些算法的性能进行比较。 相似文献
3.
数据挖掘中聚类算法研究进展 总被引:6,自引:0,他引:6
聚类分析是数据挖掘中重要的研究内容之一,对聚类准则进行了总结,对五类传统的聚类算法的研究现状和进展进行了较为全面的总结,就一些新的聚类算法进行了梳理,根据样本归属关系、样本数据预处理、样本的相似性度量、样本的更新策略、样本的高维性和与其他学科的融合等六个方面对聚类中近20多个新算法,如粒度聚类、不确定聚类、量子聚类、核聚类、谱聚类、聚类集成、概念聚类、球壳聚类、仿射聚类、数据流聚类等,分别进行了详细的概括。这对聚类是一个很好的总结,对聚类的发展具有积极意义。 相似文献
4.
聚类是一种非常有用的数据挖掘方法,可用于发现隐藏在数据背后的分组和数据分布信息。CURE算法就是一个典型的代表。本文对CURE算法进行了研究,它能够很好的解决传统聚类算法在伸缩性、数据定期更新时所面临的问题。 相似文献
5.
魏丽 《数字社区&智能家居》2007,(21)
聚类分析技术是数据挖据中的一种重要技术.本文介绍了数据挖掘对聚类的典型要求和聚类方法的分类,研究分析了聚类的主要算法,并从多个方面对这些算法的性能进行比较. 相似文献
6.
数据挖掘中聚类算法比较研究 总被引:16,自引:0,他引:16
聚类算法是数据挖掘的核心技术,本文结合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中常用聚类算法作了比较分析,以便于人们更容易,更快捷地找到一种适用于特定问题的聚类算法。 相似文献
7.
经典的密度聚类算法是DBSCAN(Density—BasedSpatialClusteringofApplicationswithNoise).它在处理空间数据时具有快速、有效处理噪声点和发现任意形状的聚类等优点。但是DBSCAN存在一些缺点,因此许多密度聚类算法被提出来,包括:基于抽样的DBSCAN、基于数据分区的DBSCAN、基于密度梯度的聚类算法和基于相对密度的聚类算法等。 相似文献
8.
聚类分析是一种基本的数据分析方法,它在数据挖掘,统计学,空间数据库技术,人工智能,生物学研究,机器学习。模式识别等领域都得到了广泛的应用。论文总结了各类聚类算法的研究现状,分析它们的优缺点,并指出了其发展趋势。 相似文献
9.
随着数据信息的积累,如何从这些海量信息中有效地提取所需要的知识成为当前数据挖掘的重要内容。聚类作为数据挖掘的重要工具,通过将数据划分成多个类,使得类内数据尽可能相似,而类间数据的相似度尽可能小,已成为研究热点。本文总结在数据挖掘中的聚类算法,针对聚类中所存在的问题进行归纳,并对未来的研究进行了展望。 相似文献
10.
11.
随着信息技术的不断发展,数据挖掘在我们的工作和生活中的应用也越来越广泛,目前聚类算法在数据挖掘中则是一个热点研究领域。本文深入研究了现阶段比较成熟的几种聚类算法,总结了这些算法的优缺点以及适用范围,提出用来评价聚类算法性能优劣的指标,也是今后聚类算法研究的出发点。 相似文献
12.
数据挖掘常用聚类算法研究 总被引:2,自引:0,他引:2
信息社会的发展,使数据量以前所未有的速度在增长,因此从海量数据中获取有用的知识和信息就变得越来越重要。数据挖掘是一种综合多领域知识而形成的数据分析技术,能够从大量数据中获取有价值的知识并为决策提供支持。聚类分析算法是数据挖掘中的一个核心内容,也是目前研究的一个热点。该文首先讲述了基于划分的聚类算法、基于分层的聚类算法、基于密度的聚类算法和基于网格的聚类算法等常用的聚类分析算法,并分析了其特点;然后通过举例详细描述了最近邻聚类算法的操作过程。聚类算法的总结,对聚类的研究和发展具有积极意义。 相似文献
13.
自组织映射(SOM)聚类算法的研究 总被引:7,自引:0,他引:7
通过自组织映射神经网络实现的聚类算法能将任意维数的输入信号模式转变为一维或二维的离散映射,以拓扑有序的方式自适应实现这个变换.介绍自组织映射聚类算法的原理,通过实验进行仿真,结果表明自组织映射聚类算法是可行有效的. 相似文献
14.
15.
16.
数据挖掘中聚类的研究 总被引:16,自引:0,他引:16
聚类是数据挖掘中重要的研究课题。文章介绍了聚类,讨论了聚类分析中的数据类型及其相异度,概括了数据挖掘中常用的聚类方法。最后,提出了聚类研究中今后的若干发展趋势。 相似文献
17.
数据挖掘中聚类分析算法性能探析 总被引:1,自引:0,他引:1
阐述聚类分析的基本概念和分类,针对目前几类主要的聚类分析方法,分析基于密度的DBSCAN算法,基于层次的BIRCH算法以及基于网格的WaveCluster算法这三种具有代表性的聚类方法,以及它们的优缺点和时间复杂度。 相似文献
18.
传统的聚类算法如Kmeans等,往往需要事先定义聚类数目。在实际应用中,多基于经验知识来确定类别个数,而且一般需要多次尝试,这种方法具有很大的盲目性。本文提出一种基于SOM的聚类算法,利用SOM的可视化功能和人眼在低维情况下对模式的快速识别能力来避免传统聚类算法确定聚类数目的盲目性。将提出的方法应用于某电信公司客户分群的实际问题当中,来刻画客户组的个性行为特征,以便销售人员制定针对性的营销策略,具有重要的实际意义。 相似文献
19.
在数据挖掘中由于每个数据对象对于知识发现的作用是不同的,为了区分这些相异之处,给每个对象赋予一定量的值,因此在PAM聚类算法的基础上提出一种W-PAM(Weight Partitioning Around Medoids)聚类算法,它为簇中数据对象加入权重来提高算法的准确率,此外利用数据对象间的关联限制能够提高聚类算法的效果。探讨了一种W-PAM算法与关联限制相结合的限制聚类算法,该算法同时拥有W-PAM算法和关联限制的优点。实验结果证明,W-PAM的限制聚类算法可以更有效地利用所给的关联限制来改善聚类效果,提高算法的准确率。 相似文献
20.
数据挖掘是指在数据库中发现潜在的、人们感兴趣的关系及特征。聚类的任务是根据一定的标准将数据分组。最常用的一种启发式算法是“爬山法”,这种方法可以保证获得局部最优。遗传算法是一种寻求全局最优的优化技术。本文将遗传算法同“爬山法”结合提出了一种混合遗传算法。 相似文献