共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
刘凤芹 《计算机光盘软件与应用》2012,(21):60-61
聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。 相似文献
3.
4.
5.
6.
7.
魏丽 《数字社区&智能家居》2007,(11):637-639
聚类分析技术是数据挖据中的一种重要技术。本文介绍了数据挖掘对聚类的典型要求和聚类方法的分类,研究分析了聚类的主要算法.并从多个方面对这些算法的性能进行比较。 相似文献
8.
离群点检测是数据挖掘一个重要内容,它为分析各种海量的、复杂的、含有噪声的数据提供了新的方法。对离群数据挖掘几类主要的方法进行了分析和评价,并在此基础上了提出了一种基于遗传聚类的离群点检测算法。该算法结合了遗传算法全局搜索的优点和K-均值方法局部收敛速度快的特点,取得较好效果。实验验证该算法很好地检测到数据集中的离群点,同时还完成了数据集的聚类。具有较好的实用性。 相似文献
9.
空间对象不仅具有非空间的属性特征,而且具有与空间位置、拓扑结构相关的空间特征。利用传统的聚类方法对空间对象进行聚类时,由于没有考虑空间关系,同一类的对象可能出现在空间不相邻的位置。基于空间邻接关系的k-means改进算法将相邻对象的空间邻接关系作为约束条件加以考虑,使聚类结果既反映了属性特征的相似程度,又反映了对象的空间相邻状态,从而可以揭示不同类别对象的空间分布格局,因此其比传统的k-means方法更适合于空间对象的聚类分析。 相似文献
10.
聚类是数据挖掘中用来发现数据分布和隐含模式的一项重要技术.阐述了聚类算法基本原理,总结了聚类算法的研究现状,按照聚类算法的分类,分析比较了几种典型聚类的性能差异和各自存在的优点及问题,并结合应用需求指出了其今后的发展趋势. 相似文献
11.
提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少、遍历时间缩短。最后使用标准数据集进行验证测试并和其他算法的比较,实验结果表明,该算法在保证结果的同时有效地提高频繁项集挖掘的效率。 相似文献
12.
传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值.将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的.同时分别设计出新的交叉算子和变异算子,并且使用的聚类有效性指标DB-Index作为目标函数,该算法很好地解决了聚类中心优化问题,与之前的两种算法相比,改进后的算法改善了聚类的质量,提高了全局的收敛速度. 相似文献
13.
14.
提出了基于模糊矩阵的数据聚类模型,其中引入了聚类过程的全局性控制模糊矩阵,描述了数据聚类的过程;提出了基于模糊矩阵的蚁群聚类算法,实验结果证明了算法的正确性和高效性。 相似文献
15.
16.
Cluster analysis is a process to classify data in a specified data set.In this field,much attention is paid to high-efficiency clustering algorithms.In this paper,the features in the current partition-based and hierarchy-based algorithms are reviewed ,and a new bierarchy-based algorithm PHC is proposed by compbining advantages of both algorithms,which uses the cohesion and the colseness to amalgamate the clusters.Compared with similar algorithms,the performance of PHC is improved,and the quality of clustering is guaranteed.And both the features were proved by the theoretic and experimental analyses in the paper. 相似文献
17.
数据挖掘中聚类算法研究进展 总被引:6,自引:0,他引:6
聚类分析是数据挖掘中重要的研究内容之一,对聚类准则进行了总结,对五类传统的聚类算法的研究现状和进展进行了较为全面的总结,就一些新的聚类算法进行了梳理,根据样本归属关系、样本数据预处理、样本的相似性度量、样本的更新策略、样本的高维性和与其他学科的融合等六个方面对聚类中近20多个新算法,如粒度聚类、不确定聚类、量子聚类、核聚类、谱聚类、聚类集成、概念聚类、球壳聚类、仿射聚类、数据流聚类等,分别进行了详细的概括。这对聚类是一个很好的总结,对聚类的发展具有积极意义。 相似文献
18.
安全审计是保护计算机遭受恶意攻击的重要技术之一。安全审计系统利用跟踪策略来实现对用户行为的跟踪。但是由于先验知识的局限,对于管理员来说很难为每个用户制定准确地跟踪策略。介绍了一种基于遗传的审计跟踪算法解决此类问题。实验证明,该算法具有实用性,并能以算法精度上损失可接受的代价(接近最优解80%以上)极大的提高算法的运行时间。使得该方法可以用在大规模多用户的环境。 相似文献
19.
医疗行业的发展扩大了医疗数据信息种类与数量,这将直接影响医院医疗水平与服务水平和医院核心竞争力。本文以医疗大数据为研究对象,提出了基于遗传算法的K-means 改进聚类方法,并以医疗费用数据为例展开分析,为提高医疗服务质量提供有效数据信息。 相似文献