首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
对聚类结果的理解有助于评价聚类效果,可以据此调整聚类过程,更高效地使用聚类结果.但是,聚类结果的理解仍然是一个尚未解决的问题.提出了基于离群点识别技术分析任意聚类算法的聚类结果,发现了聚类结果属性特征簇的方法;提出一种基于不相似性比值的离群点识别算法.通过对全部数据簇的属性描述进行离群点分析,发现各数据簇的特征属性,实现对聚类结果的理解.所提方法适用于任意聚类算法结果的分析.对UCI的iris、ZOO和Housing数据集的采用X-means、Frozen和DBScan算法的聚类结果进行聚类结果分析,实验表明所提方法较成功地发现了不同聚类算法的属性特征簇,有助于对聚类结果的深入理解.  相似文献   

2.
针对近似等距的非刚性变换的三维模型簇对应关系计算准确率不高的问题,提出采用无监督的三维模型簇对应关系协同计算的新方法.通过三维点云特征提取模块,获取将位置、细节信息更丰富的低维特征与语义信息更丰富的高维特征相融合后的特征.在无监督深度函数映射模块中,将提取到的融合特征转换为谱描述符,计算函数映射矩阵,对该矩阵施加加权正则化约束项,得到最优的函数映射矩阵.在模型簇对应关系协同计算模块中,结合循环一致性约束与函数映射理论,求解最优的目标函数,得到最优的模型簇对应关系.实验结果表明,所提算法在FAUST、SCAPE和TOSCA 3个数据集上所构建的模型簇对应关系测地误差均小于目前主流方法,映射结果更加平滑,对应关系更加准确,具有良好的泛化能力.  相似文献   

3.
一种基于聚类集成的无监督特征选择方法   总被引:1,自引:0,他引:1  
提出了一种无监督的特征选择方法,其基本思想是利用聚类来指导特征选择,对于无类别标签的数据样本集,先进行聚类获得数据类标签,再利用ReliefF算法进行特征选择.采用聚类集成方法解决一些聚类结果的不稳定问题,最终特征选择结果通过多次特征选择综合得到.实验结果表明,该算法具有良好的特征选择性能,在去除无关或冗余特征后可进一步提高聚类质量.  相似文献   

4.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

5.
传统聚类算法无法实时处理足球运动员跑动产生的动态增量数据,为此提出一种基于簇特征的大规模跑动数据聚类算法。利用k-means算法对初始数据进行聚类,并保留聚类后各簇特征,当跑动过程产生的增量数据到来时,利用表示原始簇信息的簇特征与增量数据进行增量聚类,避免传统算法因需重新聚类而导致耗时过长的问题。针对k-means算法容易产生概念偏移的现象,利用簇特征快速检测,避免聚类结果不一致。实验结果表明,该算法能快速处理动态增量数据,且聚类结果一致。  相似文献   

6.
提出了一种改进的同时正交基聚类特征选择(Improved Unsupervised Simultaneous Orthogonal Basis Clustering Feature Selection,ISOCFS)方法。为有效地对无标签数据进行特征选择,利用目标矩阵来设计正则化的回归模型。目标矩阵通过正交基聚类,获取投影数据点的潜在聚类中心,引导投影矩阵选择判别性的特征。与先前的无监督特征选择方法不同,ISOCFS并不使用数据点预先计算局部结构信息描述目标函数,而是利用目标矩阵进行正交基聚类直接计算潜在的聚类信息。其次,为了减少噪声信息对估计目标矩阵和投影矩阵的干扰,在先前方法基础上,该方法增加了噪声项。另外,该方法利用简单的优化算法即可求解。最后,通过四个常见的微阵列基因表达数据集及五种最近的无监督特征选择方法进行对比实验,证明了ISOCFS方法可以获得更好的聚类效果。  相似文献   

7.
基于视觉和语义融合特征的阶段式图像聚类   总被引:1,自引:0,他引:1  
针对互联网图像的特点,研究了图像聚类中的图像特征提取和聚类算法,定义了一个基于规则的线性特征融合函数,引入了自适应的参数选择机制对聚类粒度进行调整,提出了一个基于视觉和语义融合特征的阶段式聚类方法.新方法结合了不同层次的图像特征,利用现有多种聚类算法的优点对图像进行聚类,同时通过关键词权值计算,为每类赋予主题关键词,并将关键词重叠率高的类进行合并.基于均方差和用户评估的实验结果表明,新的聚类方法较传统的聚类方法具有更好的聚类效果.  相似文献   

8.
在聚类过程中结合簇内紧凑度信息和特征权值分布信息,对数据集的划分和各个簇类所在的子空间两方面进行优化。实验结果表明,该算法相比已有的软子空间聚类算法具有更好的聚类效果。  相似文献   

9.
基于特征权重的遗传聚类方法   总被引:1,自引:0,他引:1  
本文提出的聚类方法与通常的分区聚类方法区别在于 :( 1 )从遗传算法角度考虑聚类问题 ;( 2 )在特征权重基础上构造个体适应度函数 ,通常的聚类方法没有考虑特征对分类的不同影响 ;( 3)用基于罚函数的小生境遗传算法处理聚类问题 ,最大限度地保证搜索到全局最优解和所有局部最优解。算法具有通用性  相似文献   

10.
为了提高彩色图像分割的精度和效率,提出了一种融合特征自适应抑制式模糊聚类图像分割算法.在Lab空间提取图像色彩信息,采用Haar小波变换与半方差函数提取图像纹理特征,得到7维融合特征以概括图像信息.利用带宽自适应的均值漂移算法生成聚类数目和初始聚类中心.根据迭代过程中隶属度的动态变化自适应生成抑制因子,以改善算法的运行...  相似文献   

11.
针对图像的低级特征表示与高级概念之间的语义鸿沟,本文利用密度聚类获得的簇分布信息和多示例学习框架在区分歧义性对象上的特点,提出了一个基于区域特征密度聚类和多示例学习的图像分类方法(DCRF-MIL)。该方法首先将每个图像分割为多个区域,将所有区域组成一个集合,在这个区域集合上,使用密度聚类算法学习到区域特征的簇分布信息;然后,将图像看作包,区域看作包中的示例,基于区域特征的簇分布信息,将包映射为簇分布空间上的一个向量作为包的特征,使得包特征带有图像区域的语义信息;最后,使用支持向量机算法,在带有包特征的训练集上训练分类器,对测试图像进行分类。在Corel图像集和MUSK分子活性预测数据集上的实验表明,DCRF-MIL算法具有分类精度高和参数易于选择等特点。  相似文献   

12.
针对模糊聚类算法对初值和聚类中心较为敏感的问题,采用和声搜索算法寻找最优聚类中心,并且改进了和声搜索算法的调音概率和随机带宽,从而加速了算法收敛。使用维度加权的方法进行特征选择,提高了聚类的性能,通过定义聚类质量评价函数提高了模糊聚类质量。采用标准数据验证了算法。结果表明,提出的聚类算法性能优于其他同类算法。  相似文献   

13.
本文提出的聚类方法与通常的分区聚类方法区别在于:(1)从遗传算法角度考虑聚类问题;(2)在特征权重基础上构造个体适应度函数,通常的聚类方法没有考虑特征对分类的不同影响;(3)用基于罚函数的小生境遗传算法处理聚类问题,最大限度地保证搜索到全局最优解和所有局部最优解。算法具有通用性。  相似文献   

14.
引入核函数,对马尔科夫随机场图像模糊聚类算法加以改进,即利用核函数把马尔科夫随机场的输入空间信息样本映射到高维特征空间,在特征空间完成聚类。对标准灰度图像添加高斯噪声和椒盐噪声,利用改进算法实现聚类,视觉效果及分割图像的峰值信噪比显示,改进算法的聚类能力、分类精度和抗噪性能均有提高。  相似文献   

15.
在各种聚类算法中,基于目标函数的K-均值聚类算法应用最为广泛,然而,K-均值算法对初始聚类中心特别敏感,聚类结果易收敛于局部最优。为此,提出基于加权处罚的K-均值优化算法。每次迭代过程中,根据簇的平均误差的大小为簇分配权值,构造加权准则函数,把样本分给加权距离最小的簇中。限制簇集中出现平均误差较大的簇,提高聚类准确率。实验结果表明,该算法与K-均值算法、优化初始聚类中心的K-均值算法相比,在含有噪音的数据集中,表现出更好的抗噪性能,聚类效果更好。  相似文献   

16.
k-means聚类算法中,初始聚类中心的选取与数据中的离群点都对算法的结果有着非常大的影响。针对这一问题,提出一种基于网格和密度的k-means聚类算法GD-k-means,该算法首先将数据集映射到网格上形成网格簇进行初步聚类,利用密度阈值将网格分为低密度网格簇和高密度网格簇,在高密度网格簇中选取初始聚类中心,并利用传统的k-means算法进行迭代,通过评价条件判定是否需要进行网格簇的合并。聚类完成之后按照距离最近的原则对低密度网格簇中的数据进行相应的分配。实验结果表明:GD-k-means算法聚类结果更稳定,并且能够抵抗噪音数据的干扰。  相似文献   

17.
针对有监督特征选择方法因为需要类信息而无法应用于文本聚类的问题,提出了一种新的无监督特征选择方法: 结合文档频和K-Means的特征选择方法。该方法首先使用文档频进行无监督特征初选,然后再通过在不同K-Means聚类结果上 使用有监督特征选择方法来实现无监督特征选择。实验表明该方法不仅能够成功地选择出最为重要的—小部分特征,而且还 能提高聚类质量。  相似文献   

18.
提出了一种用于排位特征变量的基于特征矩阵信息增益的无监督特征标注准则(IGC)及直接选择法(DS)、累积最大熵法(CEM)和最大信息增益法(IGM)3种新的特征过滤方法来降低聚类的复杂度.使用经典的QC或K-means聚类算法,在杆状病毒数据集(RSV)、混合血统白血病数据集(MLL)和急性白血病患者数据集(ALP)等3种不同的生物信息数据集上测试并对比了这些特征过滤方法和目前的偏差选择(VS)和基因修剃(GS)过滤方法对聚类结果的影响.试验结果表明,3种特征过滤方法在加速聚类过程及保持初始数据的聚类结构上都具有明显的优势.  相似文献   

19.
基于自组织特征映射神经网络的点云数据分区   总被引:2,自引:0,他引:2  
自组织特征映射神经网络SOFM可以实现无监督的特征聚类.利用SOFM实现逆向工程中点云数据分区,通过改进SOFM网络初始权值方法以及引进能量函数控制迭代次数,提高了SOFM的分区效率.利用SOFM方法实现点云数据分区具有较强的容错性能,对测量数据点无任何要求.实例运行结果验证了此方法的可行性.  相似文献   

20.
在无先验知识的前提下,复杂网络聚簇需确定簇数并精确地将节点分配到其所属簇,而大部分传统聚簇方法无法自动确定簇数。为解决这一问题,结合GEP和信息论聚类框架,提出了复杂网络自动聚簇算法——AutoC-NC-GEP。算法为复杂网络聚簇建立了GEP结构模型,设计了有效的遗传算子,提出了"不完全聚簇划分"概念,并分别以Map Eqation和Modularity两种不同的网络社团结构量化函数为适应度函数,使用真实网络对算法的聚簇性能进行了测试。实验结果表明,在没有先验知识的前提下,AutoCNC-GEP算法不仅能正确解析网络的社团数量,还可以自动将节点精确地分配到其所属社团中,从而获得网络的最佳社团结构。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号