首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
MCL是一种图聚类算法,针对 MCL计算过程会产生小聚类及边缘节点从团中脱离出来的问题,提出了一种基于 MCL与 KNN相结合的混合聚类算法。该算法利用 KNN的分类特点,以 MCL聚类得到的聚类表为依据,通过 KNN对小聚类中的元素进行再分类,以提高聚类的质量。实验证明此方法是可行的,改进后的算法能使聚类质量有所提高。  相似文献   

2.
现有的标注聚类算法大多采用传统的K-means或Single-linkage算法对标注数据直接聚类,但是K-means或Sin-gle-linkage本身固有的缺陷严重影响了聚类结果的质量.给出了一种局部中心度传播聚类算法LCIPC(local centrality in-formation passing clustering),该算法首先在标注相似度的基础上建立标注数据的KNN有向邻居图G;然后利用核密度估计方法计算每个标注的局部中心度;再通过随机游走方法在图G中传播局部中心度,以产生全局中心度等级;最后,调用图深度优先搜索算法发现标注聚类结果.在3个真实数据集上的聚类结果显示,LCIPC算法具有够获得高质量标注聚类结果的能力.  相似文献   

3.
针对聚类神经网络初始权值与样本分类数的设定问题,提出一种基于网格和密度的聚类神经网络结构优化算法.以网格和密度为工具提取聚类样本的聚类中心,并由此确定样本分类数,从而对聚类神经网络结构进行优化,可以有效地提高神经网络的聚类效果,缩短样本聚类时间.  相似文献   

4.
针对于K-means算法的缺点做出了一些改进,提出了一种基于KNN算法改进K-means的算法。改进后的算法解决了K-means算法K值无法确定和数据分类中的不强、易受异常数据干扰的缺点,提高了算法的聚类效果以及削弱初始聚类中心选择的随机性对于聚类结果易陷入局部最优的影响。实验表明,改进后的算法不仅解决了传统算法确定K值的问题,而且聚类结果稳定且聚类效果良好。  相似文献   

5.
针对大型室内场景下现有指纹定位算法运算复杂度高、定位精度低的问题,提出一种基于模拟退火聚类的室内定位算法。该算法采用模拟退火聚类的方法完成对指纹空间的聚类和划分,有效降低了指纹匹配所需的候选指纹数量,并消除了具有一定特征相似性的奇异点,从而降低了运算复杂度,提高了定位精度。实验结果表明,该算法可计算出定位环境下指纹空间的最优聚类数从而确保定位精度,较K 均值聚类定位算法和KNN算法定位精度高,且定位精度不受初始值影响。  相似文献   

6.
结合基于视觉原理的密度聚类算法对初始化参数不敏感、能发现任意形状的聚类、能够找出最优聚类及一趟聚类算法快速高效的特点,研究可以处理混合属性的高效聚类算法.首先简单改进基于视觉原理的密度聚类算法,使之可以处理含分类属性的数据,进而提出一种两阶段聚类算法。第一阶段使用一趟聚类算法对数据集进行初始划分,第二阶段利用基于视觉原理的密度聚类算法归并初始划分而得到最终聚类。在真实数据集和人造数据集上的实验结果表明,提出的两阶段聚类算法是有效可行的。  相似文献   

7.
一种聚类质量的评价方法及其应用   总被引:1,自引:0,他引:1  
提出一种聚类质量的评价方法,它依据以类内相似度和类外相似度描述的相关数据集的自然结构来计算给定聚类结果的分类质量.初步的实验和分析表明,该方法基本符合人类的分类直觉,可以单独用来对聚类结果进行评价,用作对其它评价方法的补充,也可以用来调整人工聚类标准.  相似文献   

8.
应用现代数据挖掘技术分析和处理大量客户的相关数据,指导公司或企业进一步加强管理和正确决策已成为一种发展趋势和必然。在数据挖掘领域中,聚类是一个重要的方法。在简单介绍聚类概念后,着重讨论了几种经典的聚类算法,并选用相应的聚类算法应用到多尔惠超市客户数据分析中,以找到客户的最佳分类,指导企业决策。  相似文献   

9.
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据.  相似文献   

10.
针对传统的基于决策树的支持向量机多类分类算法运算过程复杂、分类效率低的缺点,提出一种新的基于聚类思想的支持向量机分类方法.空间距离和聚类思想的引入,有效的提高了算法的分类效率.仿真试验表明,该方法在保持算法良好推广性的同时降低了算法的复杂度,从而提高了分类效率和分类速度.  相似文献   

11.
现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果.  相似文献   

12.
基于减法聚类与聚类有效性评判的FCM聚类   总被引:3,自引:0,他引:3  
提出了一种基于减法聚类和聚类有效性评判的FCM聚类算法,依靠减法聚类来确定聚类数目的上限,并且在搜索最佳聚类数copt时,不需要进行重复的初始化工作,从而提高聚类的效率.  相似文献   

13.
将湖泊作为一个灰色系统,用灰色聚类法对其水体进行富营养化评价,以便为湖泊的管理提供依据。确定叶绿素a(Chl-a)、总磷(TP)、总氮(TN)、化学需氧量(COD)与透明度(SD)五个污染指标作为聚类指标,参照中国湖泊富营养化评价标准,将富营养化分为6个级别作为6个灰类,并将污染指标监测数据和灰类值进行无量纲化处理;计算各聚类对象的各污染指标对各灰类的白化权函数和聚类权;进而计算出各聚类对象的聚类系数,最后按照最大隶属度原则确定聚类对象所属的类别。并以东昌湖为例,验证了应用灰色聚类法对湖泊水体进行富营养化评价的准确性和实用性。  相似文献   

14.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性.  相似文献   

15.
为了有效利用少量先验信息提高多视角数据聚类效果,提出了一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间.然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明:ML-SMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有效提高聚类效果。  相似文献   

16.
在各种聚类算法中,基于目标函数的K-均值聚类算法应用最为广泛,然而,K-均值算法对初始聚类中心特别敏感,聚类结果易收敛于局部最优。为此,提出基于加权处罚的K-均值优化算法。每次迭代过程中,根据簇的平均误差的大小为簇分配权值,构造加权准则函数,把样本分给加权距离最小的簇中。限制簇集中出现平均误差较大的簇,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在含有噪音的数据集中,表现出更好的抗噪性能,聚类效果更好。  相似文献   

17.
抑制式模糊C-均值聚类研究综述   总被引:1,自引:0,他引:1  
模糊C-均值聚类及其各种变形和推广在实际应用中取得了巨大成就,获得了国际学者的广泛认可。目前,国际上形成了以硬C-均值聚类、模糊C-均值聚类、可能性C-均值聚类为基础的三大聚类算法簇。抑制式模糊C-均值聚类算法架起了连接硬C-均值聚类算法和模糊C-均值聚类算法的一个桥梁,本文就抑制式模糊C-均值聚类的研究现状进行综述,以期对该算法的更深入研究和应用起到推动作用。  相似文献   

18.
一种新的聚类算法:等密度线算法   总被引:10,自引:3,他引:7  
提出了一种新的聚类算法:等密度线聚类算法。该算法从样本分布等密度线图的思想出发,从图中找出样本分布比较集中的区域,从而发现隐含在样本集中的类。等密度线聚类算法不需要输入任何参数,是一种无监督式聚类。它能够自动发现任意形状的类,并且能有效地排除噪声干扰。实验结果表明,等密度线聚类算法具有较快的聚类速度和较好的聚类效果。  相似文献   

19.
基于视觉和语义融合特征的阶段式图像聚类   总被引:1,自引:0,他引:1  
针对互联网图像的特点,研究了图像聚类中的图像特征提取和聚类算法,定义了一个基于规则的线性特征融合函数,引入了自适应的参数选择机制对聚类粒度进行调整,提出了一个基于视觉和语义融合特征的阶段式聚类方法.新方法结合了不同层次的图像特征,利用现有多种聚类算法的优点对图像进行聚类,同时通过关键词权值计算,为每类赋予主题关键词,并将关键词重叠率高的类进行合并.基于均方差和用户评估的实验结果表明,新的聚类方法较传统的聚类方法具有更好的聚类效果.  相似文献   

20.
随着数据流规模的持续增大,现有基于网格的聚类算法对数据流的聚类效果不好,不能实时发现任意形状的簇,也不能及时删除数据流中的噪声点。文章提出了一种Hadoop平台环境下基于网格密度的分布式数据流聚类算法(PGDC Stream),利于基于Hadoop的MapReduce框架对数据流进行阶段化的并行聚类分析,实时发现数据流中任意形状的簇,定义检测周期和密度阈值函数并及时删除数据流中的噪声点。算法基于网格密度对数据流初始聚类后,随着新数据的到来,使用基于密度阈值函数的噪声点处理策略,周期性检测和删除噪声点,使用基于Hadoop MapReduce框架的并行分析模型周期性地调整已经生成的簇。实验结果表明,PGDC Stream对大规模数据流的聚类质量、可伸缩性和实时性都好于CluStream。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号