首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
基于构造性核覆盖学习方法的思想,提出了一种构造性核覆盖聚类算法.首先将原空间的待分类样本映射到一个高维的特征空间中,使得样本变得线性可分,然后在核空间采用构造性覆盖方法进行覆盖领域的构造,这组领域能将相似度小的样本分割开来,将相似度大的样本聚合在一起,通过定义一定的相似度度量标准和目标函数,达到聚类的效果.仿真实验也验证了该方法的有效性和可行性.  相似文献   

2.
流形数据由一些弧线状或环状的类簇组成,其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此,本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearest neighbor for manifold datasets,DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式,使得同一流形类簇样本间的相似度尽可能高;基于上述相似度定义局部密度,不忽略距类簇中心较远样本的密度贡献,能更好地区分出流形类簇的类簇中心与其他样本;根据样本的相似度分配剩余样本,避免了样本的连续误分配。DPC-SNN算法与DPC、FKNNDPC、FNDPC、DPCSA及IDPC-FA算法的对比实验结果表明,DPC-SNN算法能够有效发现流形数据的类簇中心并准确完成聚类,对真实以及人脸数据集也有不错的聚类效果。  相似文献   

3.
分析短波波段复杂电磁环境下跳频信号检测存在的难点,并根据短波通信信号的特点,提出一种时间、频谱和幅度关联的检测方法,称之为时频幅三维关联法.文章主要结合商空间粒度分析理论,提出改进的覆盖聚类算法,并对截获的海量复杂数据进行预处理,消除了噪声,然后运用时频幅三维关联法,排除定频信号、突发信号等.实验结果说明该方法能够有效地检测出跳频信号,验证了方法的实效性.  相似文献   

4.
传统的覆盖方法形成的覆盖都是"优簇",但是无法形成非球状的覆盖;而聚类求覆盖的方法就可以得到非球状覆盖,但是由于很难事先找到合适的相似度,所以无法求得全部"优簇".文中把两者的优点结合起来并加以推广,与SVM, NaiveBayes,交叉覆盖等学习方法相结合,形成基于聚类优化覆盖的集成学习方法,这样求得的覆盖既可以是非球状覆盖,又是全"优簇",优化了覆盖领域.实验证明该方法产生的覆盖不仅数量上较少,并且覆盖的准确率较高,具有一定的抗噪声能力.  相似文献   

5.
聚类集成是聚类的一个重要分支,它用于融合多个基聚类,来生成具有鲁棒性和高质量的最终聚类划分。将原始信息转化为共协矩阵,通过共协矩阵得到最终聚类划分的聚类集成方法是目前很多研究者研究的内容,然而大多数研究者都忽略了聚类结果容易受到噪声的影响,且忽略了共协矩阵在数据量大时,时间以及空间复杂度高的问题。为了解决以上问题,该文设计了一种基于类间相似性的聚类集成方法(CSCE)。该方法首先基于证据积累模型找到原始对象之间的相似性,将原始对象划分为多个小簇。然后通过一种新的相似度计算方法,计算簇与簇之间的相似度,形成簇与簇的相似矩阵。最后通过归一化切割(NCUT)切图的方法,将簇相似矩阵划分为最终聚类结果。该方法将低质量异常对象按相似度并入与之相似的簇中,并在8个数据集上进行了实验。结果表明,该方法不仅聚类效果好,而且解决了传统共协矩阵时间以及空间复杂度高的问题。  相似文献   

6.
K-means聚类是一种简捷高效、收敛速度快且易于实现的统计分析方法,但是传统的K-means聚类算法对初始聚类中心的选取敏感且易陷入局部最优,同时多数无监督特征选择算法容易忽视特征之间的联系。为此,提出了一种结合人工蜂群与K-means聚类的特征选择方法。首先,为了使同一簇中样本的相似度高而不同簇中样本的相似度低,基于簇内聚集度和簇间离散度构建了新的适应度函数,更好地反映各样本的特性,进而构建了蜜源被选择新的概率表达式;其次,设计了随着迭代次数的增加而数值逐渐减小的权重,提出了使蜂群搜索范围动态缩进的蜜源位置更新表达式;然后,为了弥补传统的欧氏距离在计算距离时仅考虑向量之间的累积差异而表现出的局限性,构造了同时考虑样本影响程度不同以及样本的相似性的加权欧氏距离表达式;最后,引入标准差和距离相关系数,定义了特征区分度与特征代表性,以二者之积度量特征重要性。实验结果表明,所提算法加快了人工蜂群算法的收敛速度并提高了K-means算法的聚类效果,同时也有效地提升了特征选择的分类效果。  相似文献   

7.
在文本分类中获得有类别标记训练样本的代价是很高昂的,本文针对这个问题对传统的模糊聚类方法进行改进,提出模糊划分聚类方法FPCM,将聚类的无监督性和样本的先验知识结合起来,通过相似度度量聚类相关文本,取得比较客观的簇和少量标记文本,为监督学习找到分类依据,并结合朴素贝叶斯增量学习方式进行分类器的学习.本文进一步用估计分类误差损失的方法平衡选取候选样本,提高了分类准确率,实现了应用范围更加广泛的无标记文本分类学习模型.  相似文献   

8.
对立方体数据的分析挖掘由于具有广泛的现实应用而日益得到人们的重视.基于对立方体切片数据的分析应用问题,提出了一种新的核心聚类分析方法.核心聚类分析主要针对传统聚类模型得到的结果类簇不够紧密和需要预先定义类簇的数目等不足之处,而点对敏感聚类模型(pair-wise cluster)算法复杂度是NP难的问题而设计.核心聚类模型将数据集合中的点划分为若干不相交的核心点集和边界点集,同一核心点集内任意点对的相似度大于阈值σ,而不同核心点集的点对相似度小于阈值σ.核心聚类模型挖掘出的核心点集是紧密类簇,并且具备良好的分类性质.由于采用了局部优化算法,核心聚类模型的算法复杂度为O(n2),较点对敏感的最大相关成员簇聚类模型大大降低.同时,可以通过核心点集和边界点集构造最大相关成员簇的上界,这就在一定程度上保证了核心聚类模型结果的完备性.实验和分析对比说明核心聚类模型具有较高的算法效率,可扩展性强,结果表示合理,能够很好地解决现实应用问题.  相似文献   

9.
多视角聚类能够整合多个视角的信息来提高聚类效果.目前很多研究都限于关注多视角一致性,得到的统一相似度图中仍存在许多非同簇之间的关系,甚至当某些簇的噪声达到一定程度时还可能导致统一相似度图难以形成簇的块对角结构.为此,本文提出一种块对角引导的多视角统一图聚类方法,该方法先将不同视角的相似度图分解成一致性部分与不一致性部分;然后通过构造不一致性关系来获得更纯净的一致性部分;进而融合所有视角的一致性部分建立一个相似度图;最后在该相似度图中加入块对角引导和连通分量约束,学习到高质量的统一相似度图.通过在六个数据集上进行对比实验,证明了本文提出的方法的有效性.  相似文献   

10.
介绍一种基于模糊逻辑的数据聚类技术,讨论了模糊C均值聚类方法。模糊C均值算法就是利用模糊逻辑理论和聚类思想,将n样本划分到c个类别中的一个,使得被划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最小。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号