首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
一种有效的聚类分析算法的研究   总被引:2,自引:0,他引:2  
本文在综合分析层次凝聚算法和k平均分区算法的优缺点和借鉴前人算法的基础上,提出了一种改进算法(ICAA算法)。实验证明ICAA算法是一种速度更快、效率更高、聚类质量更好的算法。  相似文献   

2.
针对高分辨率天文图像中的星点聚类研究中存在的 2 个问题:①天文图像的分辨率 较高,且图像处理速度较慢;②选取何种聚类算法对天文图像中的星点进行聚类分析效果较好。 在研究中,问题 1 采用图像分块的方法提高图像的处理速度;问题 2 提出了一种改进的 K 均值聚 类算法,以解决传统的 K 均值聚类算法的聚类结果易受到 k 值和初始聚类中心随机选择影响的问 题。该算法首先在用 K 均值聚类算法对数据初步聚类的基础上确定合适的 k 值,其次用层次聚类 对数据聚类确定初始聚类中心,最后在此基础上再采用 K 均值聚类算法进行聚类。通过 MATLAB 仿真实验的结果表明,该算法的聚类结果与效率优于其他聚类算法。  相似文献   

3.
针对传统聚类算法聚类质量不够理想、自适应性不强和易陷入局部极小值等缺陷,提出一种基于改进免疫算法的数据聚类算法,该算法通过引入生物免疫系统中的精英保留策略和期望繁殖率,使适应度高的个体得到保留,浓度高的个体得到抑制,提高了算法的自适应性和精度,在后期通过利用混沌优化方法,使算法的局部搜索能力得到增强。实验结果表明,该算法比传统的聚类算法具有更好的性能。  相似文献   

4.
孙倩  陈昊  李超 《计算机应用研究》2020,37(6):1707-1710,1764
针对大数据聚类算法计算效率与聚类性能较低的问题,提出了一种基于改进人工蜂群算法与MapReduce的大数据聚类算法。将灰狼优化算法与人工蜂群算法结合,同时提高人工蜂群算法的搜索能力与开发能力,该策略能够有效地提高聚类处理的性能;采用混沌映射与反向学习作为ABC种群的初始化策略,提高搜索的解质量;将聚类算法基于Hadoop的MapReduce编程模型实现,通过最小化类内距离的平方和实现对大数据的聚类处理。实验结果表明,该算法有效地提高了大数据集的聚类质量,同时加快了聚类速度。  相似文献   

5.
改进的K-means聚类k值选择算法   总被引:1,自引:0,他引:1       下载免费PDF全文
空间聚类算法中,聚类的效果在很大程度上受制于最佳[k]值的选择。典型的[K]-均值算法中,聚类数[k]需要事先确定,但在实际情况中[k]的取值很难确定。针对手肘法在确定[k]值的过程中存在的“肘点”位置不明确问题,基于指数函数性质、权重调节、偏执项和手肘法基本思想,提出了一种改进的[k]值选择算法ET-SSE算法。通过多个UCI数据集和[K]-means聚类算法对该算法进行实验,结果表明,使用该[k]值选择算法相比于手肘法能更加快速且准确地确定[k]值。  相似文献   

6.
为解决传统聚类算法不能处理非球形分布数据的问题,文犤5犦提出了一种自适应k近邻聚类算法。该算法在无需聚类数目的前提下,能有效解决非球形分布数据的聚类问题。但进一步的研究表明,该算法在处理带“奇异”样本的数据集时失去效果。为此,该文给出了一种改进的自适应k近邻聚类算法。仿真结果表明,新算法不仅保持了原算法在处理非球形分布数据时的优良特性,还成功解决了“奇异”样本问题。  相似文献   

7.
文档聚类中k-means算法的一种改进算法   总被引:14,自引:0,他引:14  
万小军  杨建武  陈晓鸥 《计算机工程》2003,29(2):102-103,157
介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理,但它对孤立点很敏感,为此,文章提出将聚类均值点与聚类种子相分离的思想,并具体给出了基于该思想的对k-means算法的改进算法,实验表明,该改进算法比原k-means算法具有更高的准确性和稳定性。  相似文献   

8.
模拟退火K均值聚类算法及其应用研究   总被引:4,自引:1,他引:3  
针对CRM客户分类,提出模拟退火算法与K均值算法相结合的聚类算法.利用模拟退火算法全局寻优能力改变k均值算法易陷入局部极值的缺点.经标准数据集检验,证明算法有效.根据烟草商业企业业务数据和卷烟营销特点分析,设计客户分类评价指标模型.将算法应用于烟草商业企业CRM客户分类,分类结果符合卷烟营销特点,从实用角度验证算法有效.根据客户分类设计了差异化CRM营销策略.  相似文献   

9.
10.
维度灾难、含有噪声数据和输入参数对领域知识的强依赖性,是不确定数据聚类领域中具有挑战性的问题。针对这些问题,基于相似性度量和凝聚层次聚类思想的基础上提出了高维不确定数据高效聚类HDUDEC(High Dimensional Un-certain Data Efficient Clustering)算法。该算法采用一个能够准确表达不确定高维对象之间的相似度的度量函数计算出对象之间的相似度,然后根据相似度阈值自底向上进行聚类分析。实验证明新的算法需要的先验知识较少、可以有效地过滤噪声数据、可以高效的获得任意形状的高维不确定聚类结果。  相似文献   

11.
数据挖掘常用聚类算法研究   总被引:2,自引:0,他引:2  
信息社会的发展,使数据量以前所未有的速度在增长,因此从海量数据中获取有用的知识和信息就变得越来越重要。数据挖掘是一种综合多领域知识而形成的数据分析技术,能够从大量数据中获取有价值的知识并为决策提供支持。聚类分析算法是数据挖掘中的一个核心内容,也是目前研究的一个热点。该文首先讲述了基于划分的聚类算法、基于分层的聚类算法、基于密度的聚类算法和基于网格的聚类算法等常用的聚类分析算法,并分析了其特点;然后通过举例详细描述了最近邻聚类算法的操作过程。聚类算法的总结,对聚类的研究和发展具有积极意义。  相似文献   

12.
一种快速的模拟退火算法及其在数据聚类中的应用   总被引:12,自引:3,他引:12  
文中把求解数据聚类问题转换为一个图形分割最优问题,提出一种快速的模拟退火算法。实验结果证明,快速模拟退火算法退火时间短,收敛速度快,把它应用于数据聚类中,可以获得较好的聚类结果。  相似文献   

13.
为了有效降低模糊C均值算法对奇异值和噪声点的敏感性,本文提出一种自步数据重构正则化模糊C均值聚类算法。传统算法是在C均值算法的目标函数中引入加权参数来实现对数据的模糊性划分,而本文提出的方法则是通过对C均值的目标函数进行数据重构正则化来实现,并以自步学习的方式逐步对数据点进行聚类。实验结果表明,本文算法在模拟数据、实际数据以及在图像分割中都能显著降低算法对奇异值和噪声数据的敏感性,聚类更为准确高效。  相似文献   

14.
随着互联网内容的快速增长,对于网络内容的快速识别压力越来越大。本文进行基于聚类算法的内容识别研 究,为维护网络安全、网络内容健康,具有非常重要的意义。目前的互联网内容识别方式主要以关键字检索方法进行识别,但 是面对日益丰富的网络内容和不同方式存储在服务器的内容,这种方式已经无法满足实际的需求。从实际问题出发针对互联 网内容中以图形、图像、音频等非结构化数据形式存储在服务器中的内容进行识别,依据互联网内容的发展规律对现有的聚类 算法进行改进,以求能够最大程度地对互联网内容进行筛选和甄别,维护互联网安全。  相似文献   

15.
关于模糊C-均值(FCM)聚类算法的改进   总被引:3,自引:0,他引:3  
针对模糊C-均值(FCM)聚类算法的容易收敛于局部极值的不足,提出了一种改进的模糊FCM聚类算法,此新算法在聚类中心选取和优化过程中进行了充分的考虑,是一种用于确定最佳聚类数的聚类算法,并且利用了分阶段思想,结合动态直接聚类算法和标准聚类算法,来尽量避免模糊C-均值(FCM)聚类算法的不足。新算法与传统(FCM)聚类算法方法相比,提高了算法的寻优能力,并且迭代次数更少,在准确度上也有较大的提高,具有很好的实际应用价值。  相似文献   

16.
基于k均值分区的流数据高效密度聚类算法   总被引:2,自引:0,他引:2  
数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的.  相似文献   

17.
数据挖掘空间聚类   总被引:1,自引:1,他引:0  
聚类分析在数据挖掘领域中得到了广泛的应用,对空间数据的聚类是其中的一个重要研究方向。文章提出了对空间数据聚类的6个标准,并基于这6个标准对一些传统的空间数据聚类算法作了分析比较。在分析的基础上指出没有一种老的算法能同时处理大量数据点、高维数据和多噪声的问题。接着对近年来改进或创新的聚类算法作了简要分析,并对未来发展方向进行了简要展望,目的主要是便于研究者全面了解和掌握空间数据聚类的现有算法,发现更高性能的聚类算法,也使用户能方便快速地找到适合特定问题的聚类方法。  相似文献   

18.
传统的K-modes算法采用简单的属性匹配方式计算同一属性下不同属性值的距离,并且计算样本距离时令所有属性权重相等。在此基础上,综合考虑有序型分类数据中属性值的顺序关系、无序型分类数据中不同属性值之间的相似性以及各属性之间的关系等,提出一种更加适用于混合型分类数据的改进聚类算法,该算法对无序型分类数据和有序型分类数据采用不同的距离度量,并且用平均熵赋予相应的权重。实验结果表明,改进算法在人工数据集和真实数据集上均有比K-modes算法及其改进算法更好的聚类效果。  相似文献   

19.
UK均值算法需要计算每个对象之间的期望距离(EDS)和聚类中心, EDS计算的成本就成了UK均值计算的性能瓶颈。为了提高UK均值的计算效率,本文提出一种优化的UK均值算法,通过一个高效的公式来估计期望距离,大大降低了UK均值的额外时间,并在实验中得以证明。我们还说明这个优化公式有效地将UK均值算法降低到了传统的基于K均值的聚类算法。  相似文献   

20.
随着信息技术的不断发展,数据挖掘在我们的工作和生活中的应用也越来越广泛,目前聚类算法在数据挖掘中则是一个热点研究领域。本文深入研究了现阶段比较成熟的几种聚类算法,总结了这些算法的优缺点以及适用范围,提出用来评价聚类算法性能优劣的指标,也是今后聚类算法研究的出发点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号