首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
《信息技术》2019,(1):66-70
针对传统K-means聚类中存在的一系列问题,文中提出了一种基于K-means聚类的改进算法。该算法首先利用K-means++聚类从数据中选择K个距离尽可能远的对象作为初始聚类中心,然后利用K-mediods聚类选择数据样本的中位数作为聚类中心的对象,最后与两步聚类结合。通过对几个常用UCI标准数据集进行仿真实验,结果表明该算法比传统算法更优。  相似文献   

2.
本文提出一种新的高效软聚类方法-截集模糊C-均值聚类。该方法将传统的硬聚类和经典的模糊聚类相统一,并进行了合理的推广而得出的一种有效的聚在方法,S2FCM聚类算法的思想更符合人的分类习惯,模拟实验表明,其总体性能优于FCM算示和HCM算法。  相似文献   

3.
一种文本聚类方法及BBS浏览机制研究   总被引:2,自引:0,他引:2  
文章旨在探索一种新的BBS浏览方式,提出了一种新的文本聚类方法.即以分等级的菜单方式组织帖子,以引导用户方便地浏览他所感兴趣的帖子,也便于了解当前BBS上的热点话题。  相似文献   

4.
自组织特征映射网络学习结束后,其输出层结点能够反映出样本空间中数据的分布情况,相似结点代表的数据也相对近似,因而通过对输出层结点的合理划分能够实现对样本空间的有效聚类,结点的划分仍然存在聚类数目不确定的问题,凝聚层次聚类每一层都代表一种聚类结果,找出结果最好的那一层所具有的簇的数目作为最佳聚类数目,是一种比较好的确定聚类数目的方法,在Iris数据集上的实验证明了该方法的有效性.  相似文献   

5.
一种新的高效软聚类方法:截集模糊C-均值(S2FCM)聚类算法   总被引:11,自引:0,他引:11  
本文提出一种新的高效软聚类方法-截集模糊C-均值聚类。该方法将传统的硬聚类和经典的模糊聚类相统一,并进行了合理的推广而得出的一种有效的聚在方法,S2FCM聚类算法的思想更符合人的分类习惯,模拟实验表明,其总体性能优于FCM算示和HCM算法。  相似文献   

6.
7.
用于数据挖掘的聚类算法   总被引:27,自引:0,他引:27  
数据挖掘用于从超大规模数据库中提取感兴趣的信息。聚类是数据挖掘的重要工具,根据数据间的相似性将数据库分成多个类,每类中数据应尽可能相似。从机器学习的观点来看,类相当于隐藏模式,寻找类是无监督学习过程。目前已有应用于统计、模式识别、机器学习等不同领域的几十种聚类算法。该文对数据挖掘中的聚类算法进行了归纳和分类,总结了7类算法并分析了其性能特点。  相似文献   

8.
本文提出了一种新的高效软聚类方法──截集模糊C-均值聚类(S2FCM).该方法将传统的硬聚类(HCM)和经典的模糊聚类(FCM)相统一,并进行了合理的推广而得出的一种有效的聚类方法,S2FCM聚类算法的思想更符合人的分类习惯,模拟实验表明,其总体性能优于FCM算法和HCM算法。  相似文献   

9.
针对轨迹聚类结果的不可靠性,提出一种基于多聚类结果融合的轨迹聚类方法MRMTC.对于多聚类器产生的多个聚类代表轨迹,提出了轨迹合并算法,实现了多个聚类代表轨迹的合并.代表轨迹合并算法以平均扫描线距离函数作为共识函数,通过共识函数对代表轨迹间的相似度进行比较,最后合并相似的代表轨迹.实验表明基于融合的轨迹聚类方法,可以获...  相似文献   

10.
提出了一种改进的蚁群聚类分析算法,通过改进LF算法中群体相似度函数,加入参数的自适应调整策略,利用短期记忆和网格信息素的局部分布控制蚂蚁的随机移动,并结合蚂蚁速度动态变化、半径递增、强制放下等特性。采用测试数据和不同的算法进行了对比实验分析,仿真实验结果表明,该算法显示出了较高的稳定性和准确率。  相似文献   

11.
汉语文本聚类及其算法设计   总被引:1,自引:0,他引:1  
主要针对传统的聚类算法倾向于识别大小类似的球形聚类簇,且对离群数据较为敏感等问题,利用聚类簇代表点选取的方法,同时结合基于人进行聚类判断所遵循的基本原则,即聚类中对象间距离应小于聚类间距离,设计了一种有效的聚类算法,实验结果表明算法是有效的。  相似文献   

12.
P2P网络是一种极具潜力的信息共享方式,当前对于它的研究成为网络技术的热点问题.P2P网络的分布、分散、组织困难等特点,使P2P网络在应用中有很多不足,这就要求提高P2P网络的应用效率,优化查询过程等.以一个无结构的,可以用无向图来表示的P2P网络为基础,首先构造了一个描述节点上文件的元数据模型,在这个模型的基础上进行语义聚类,并定义了一个聚类特征向量来描述生成的聚类.在完成本地节点上的聚类以后,再进一步进行节点间的聚类,提出了朋友聚类的概念,基于朋友聚类构建语义覆盖网,它可以大大提高查询效率.  相似文献   

13.
文本聚类是数据挖掘的核心技术,能帮助用户有效地导航、总结和组织文本信息。本文通过对文本聚类的应用研究,探讨了几种聚类算法的原理与特点,提出并分析了K-means算法与层次凝聚算法的具体实现步骤。  相似文献   

14.
可能性模糊C-均值聚类新算法   总被引:17,自引:4,他引:13       下载免费PDF全文
模糊C-均值聚类(FCM)对噪声数据敏感和可能性C-均值聚类(PCM)对初始类中心非常敏感易导致一致性聚类.可能性模糊C-均值聚类(PFCM)综合了FCM和PCM算法并且克服了这些缺点.但是PFCM必须先运行FCM来计算参数.提出一种新的PCM算法,新的PCM算法利用协方差矩阵来计算参数衡量了数据集的紧凑程度且无须先运行FCM,在新的PCM和FCM基础上提出了新PFCM算法,该算法无须事先运行FCM以计算参数,减少了算法运算时间.对数据集的测试实验结果表明了提出的新算法能同时产生模糊隶属度和典型值,减少聚类时间,同时具有更好的分类准确率.  相似文献   

15.
常彤 《通讯世界》2017,(19):289-290
K-means算法因其简单、易理解、速度快等优点在众多领域得到广泛的应用,然而该算法的K值选取,初始聚类点的选取和对于孤立点的处理等都会影响最终聚类结果.根据k-means算法目前的应用研究现状,针对这些缺点对算法进行改进,最后指出了改进中存在的一些问题,并指出未来的研究方向.  相似文献   

16.
该文针对现有的谱聚类方法用于极化SAR图像分类时精度较低的问题,提出一种基于马尔科夫的判别谱聚类方法(MDSC),具有低秩和稀疏分解的特点。该方法首先恢复一个真实的低秩概率转移矩阵,将其作为标准马尔科夫谱聚类方法的输入,以减少噪声对分类结果的影响;然后在目标函数中引入判别信息,使极化SAR图像的数据信息能够得到更加充分地利用;最后采用增广拉格朗日乘子法来解决低秩和概率单纯形约束下的目标函数优化问题。在荷兰小农田、德国、西安和荷兰大农田4个不同数据集上的实验证明,该方法具有较好的准确率,且参数敏感性较低,表现出了良好的分类性能。   相似文献   

17.
一种改进的快速HCM颜色聚类算法   总被引:1,自引:1,他引:0  
针对传统HCM算法运算时间过长且易陷入局部最优解的缺点,提出一种结合金字塔结构与减法聚类的HCM算法.该算法先将图像描述为不同尺度上的金字塔图像序列,对顶层图像运用减法聚类确定初始中心后进行HCM,然后依次将上一层图像的聚类结果作为初始中心对本层图像进行HCM聚类,对最底层聚类得到的结果即是最终的聚类结果.仿真试验表明,该算法的运行时间远远低于传统HCM算法,且聚类质量比传统HCM算法好.  相似文献   

18.
聚类算法在数据分析与图象处理等许多方面应用十分广泛,尤其是模糊C均值(FCM)聚类算法受到人们的普遍重视。象其它聚类算法一样,进行FCM聚类时,需事先确定一些参数,如:聚类类别数C模糊加权指数m、向量范数等。如何确定数据的最佳分类,使之能准确真实地反映实际数据的内部结构,这就是聚类的有效性问题。本文在实验的基础上对FCM聚类算法进行有效性分析,并提出了一个能表征FCM聚类有效性的启发性函数,得到了一些有用结论。  相似文献   

19.
基于可能性分布的聚类有效性   总被引:20,自引:2,他引:18  
范九伦  裴继红  谢维信 《电子学报》1998,26(4):113-115,100
依据可能性理论,本文引入了一个新的划分系数,结合J.C.Bezrlek给出的划分系数,定义一个新的聚类有效性函数,计算机模拟表明该聚类有效性函数具有良好的判决功能和鲁棒性。  相似文献   

20.
随着互联网应用的发展,越来越多的患者通过在线健康社区获取健康信息。以"甜蜜家园"为例,通过描述性统计和聚类模型,分析用户行为特征,对论坛用户生成内容进行主题聚类并绘制词云图以挖掘用户需求特征,从用户行为和需求两个维度构建用户画像,以期为在线健康运营者提供启示和建议方法,更好地为用户提供服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号