首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 615 毫秒
1.
刘白  周永权  谢竹诚 《计算机应用》2009,29(6):1569-1571
针对传统的模糊C-均值(FCM)聚类算法的聚类有效性对空间样本分布的依赖性等缺点,提出了一种新的基于人工鱼群算法的动态模糊聚类。通过引入模糊等价矩阵来表示高维样本之间的相似程度,并将高维样本映射到二维平面。然后利用人工鱼群算法不断优化二维样本的坐标值,使样本之间的欧氏距离向样本间的模糊等价矩阵趋近,最终实现模糊聚类。该方法克服了聚类有效性对高维样本空间分布的依赖性并同时提高了效率。仿真实验结果证明了该算法是有效的,具有聚类速度快、精度高等特点。  相似文献   

2.
将高维的大数据集随机分成若干个子集,对每个子集聚类采用一种基于遗传算法的高维数据模糊聚类方法。该方法引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本随机初始化到二维平面,利用遗传算法迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近。将得到的最优的二维样本用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明,该算法有较好的聚类效果,且极大地提高了聚类的速度。  相似文献   

3.
朱林  雷景生  毕忠勤  杨杰 《软件学报》2013,24(11):2610-2627
针对高维数据的聚类研究表明,样本在不同数据簇往往与某些特定的数据特征子集相对应.因此,子空间聚类技术越来越受到关注.然而,现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究中.为此,利用模糊可扩展聚类框架,与熵加权软子空间聚类算法相结合,提出了一种有效的熵加权流数据软子空间聚类算法——EWSSC(entropy-weighting streaming subspace clustering).该算法不仅保留了传统软子空间聚类算法的特性,而且利用了模糊可扩展聚类策略,将软子空间聚类算法应用于流数据的聚类分析中.实验结果表明,EWSSC 算法对于高维数据流可以得到与批处理软子空间聚类方法近似一致的实验结果.  相似文献   

4.
提出了一种基于遗传算法的高维数据模糊聚类方法。引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本初始化到二维平面。利用遗传算法进行迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近,使高维样本映射到二维平面。最后将得到的最优的二维样本利用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明利用该方法有较好的聚类效果,且比用FCM算法直接聚类收敛速度快。  相似文献   

5.
李森  刘希玉 《计算机应用研究》2012,29(11):4093-4096
针对高维数据的聚类问题,提出一种基于间隔Fisher分析(MFA)的半监督聚类算法。该算法首先使用已标记样本进行MFA映射,得到投影矩阵W后,再利用求得的投影方法对未标记样本进行降维;然后在低维空间引入基于约束的球形K-means(PCSKM)算法对降维后的数据进行半监督聚类,根据第一次的聚类结果,交替进行降维与聚类操作,直到算法收敛为止。该算法利用监督信息有效地集成了数据降维和半监督聚类。实验结果表明,该方法能够有效处理高维数据,同时能提高聚类性能。  相似文献   

6.
半监督维数约简是指借助于辅助信息与大量无标记样本信息从高维数据空间找到一个最优低维判别空间,便于后续的分类或聚类操作,它被看作是理解基因序列、文本与人脸图像等高维数据的有效方法。提出一个基于成对约束的半监督维数约简一般框架(SSPC)。该方法首先通过使用成对约束和无标号样本的内在几何结构学习一个判别邻接矩阵;其次,新方法应用学到的投影将原来高维空间中的数据映射到低维空间中,以至于聚类内的样本之间距离变得更加紧凑,而不同聚类间的样本之间距离变得尽可能得远。所提出的算法不仅能找到一个最佳的线性判别子空间,还可以揭示流形数据的非线性结构。在一些真实数据集上的实验结果表明,新方法的性能优于当前主流基于成对约束的维数约简算法的性能。  相似文献   

7.
动态权值混合C-均值模糊核聚类算法*   总被引:2,自引:1,他引:1  
PCM算法存在聚类重叠的缺陷,PFCM算法同时利用隶属度与典型值把数据样本划分到不同的类中,提高了算法的抗噪能力,但PFCM算法对样本分布不均衡的聚类效果并不十分理想。针对此不足,可以通过Mercer核把原来的数据空间映射到特征空间,并为特征空间的每个向量分配一个动态权值,从而得到特征空间内的目标函数。理论分析和实验结果表明,相对于其他经典模糊聚类算法,新算法具有更好的健壮性和聚类效果。  相似文献   

8.
一种快速山峰聚类算法*   总被引:1,自引:1,他引:0  
山峰聚类既可以对数据集进行近似聚类,又可以为其他聚类方法提供聚类所需的初始聚类中心。减法聚类是山峰聚类的改进,它避免了山峰聚类中出现的计算量随样本维数增加呈指数增长的情况。但减法聚类对处理大样本集也力不从心。引入了P-tree数据结构,对高维大样本集进行分解,然后用减法聚类对子样本集进行聚类。此算法既避免了山峰聚类的维数灾难问题,也解决了减法聚类中样本数太大的问题。实验结果证明,该算法有效地减少了运算量,提高了聚类的速度。  相似文献   

9.
建立一种离群样本划分的半监督模糊学习算法模型。首先,提出一种基于Hopfield参数估计的松弛条件模糊鉴别分析算法,重新定义每一个样本的隶属度,并在特征抽取的过程中,根据隶属度对散布矩阵的定义所做的贡献获得每个样本相应的类别信息,由此获得普通样本分类信息。其次,根据样本隶属度的分布信息划分出离群样本空间,将普通样本分类结果作为离群样本聚类的先验类属信息,并对该空间样本提出一种新的半监督模糊学习策略进行动态聚类。该算法同时具备了监督学习和无监督学习方法的优势,克服了传统聚类缺乏类过程知识的缺点,可以有效地解决特征空间中特殊样本的分类问题。性能分析表明,该方法优于单一的特征抽取方法,在NUST603、ORL、XM2VTS和FERET人脸数据库上的识别性能均得到有效提高。  相似文献   

10.
随着信息技术的飞速发展和大数据时代的来临,数据呈现出高维性、非线性等复杂特征。对于高维数据来说,在全维空间上往往很难找到反映分布模式的特征区域,而大多数传统聚类算法仅对低维数据具有良好的扩展性。因此,传统聚类算法在处理高维数据的时候,产生的聚类结果可能无法满足现阶段的需求。而子空间聚类算法搜索存在于高维数据子空间中的簇,将数据的原始特征空间分为不同的特征子集,减少不相关特征的影响,保留原数据中的主要特征。通过子空间聚类方法可以发现高维数据中不易展现的信息,并通过可视化技术展现数据属性和维度的内在结构,为高维数据可视分析提供了有效手段。总结了近年来基于子空间聚类的高维数据可视分析方法研究进展,从基于特征选择、基于子空间探索、基于子空间聚类的3种不同方法进行阐述,并对其交互分析方法和应用进行分析,同时对高维数据可视分析方法的未来发展趋势进行了展望。  相似文献   

11.
经典的K-Means算法认为被分析样本的各个属性对聚类结果的贡献均匀,没有考虑不同属性特征对聚类结果可能造成的不同影响。文章提出了一种基于样本属性加权的K-Means算法。该算法利用变异系数赋权法对属性进行加权处理,通过权值反映各个属性对聚类结果的贡献的大小。实验表明,该算法在不改变时间、空间复杂度的情况下能取得更好的聚类结果。  相似文献   

12.
自动采集样本的图像颜色传递算法   总被引:9,自引:2,他引:9       下载免费PDF全文
图像的颜色传递是将一幅图像的颜色特征传递给另一幅图像,使目标图像具有与源图像相似的色彩。提出了一种自动采集样本的图像颜色传递方法,利用无监督学习聚类把目标图像和源图像分别分成一定数量的色彩相近的子块,通过计算各子块的纹理特征和亮度统计值,建立样本块之间的对应关系。从各子块中取出数据点密度较大的像素组成样本块。进而利用最佳匹配算法,查找目标样本块的像素在源图像对应样本块中的最佳匹配像素,将其颜色值传给目标像素。以目标图像中已完成颜色传递的样本块作为参考样本,使用纹理对比方式完成样本块以外其它像素的颜色传递。该自动采集样本算法既可用于彩色图像间颜色传递,也适用于灰度图像与彩色图像间颜色传递。在目标图像和源图像的各子块有明显纹理和亮度特征时,该算法可方便地用于批处理和视频中。  相似文献   

13.
由于当今的网络数据是海量的,因此科研人员对某些问题进行研究时需要将不同属性的数据从中提取出来,然而在提取这些数据之前需要将相同数据进行聚类。数据聚类的过程,也就是寻找数据最优属性的过程,然而人工蚁群就是一种寻找问题最优解的算法,因此在本文中再次将蚁群算法在聚类中进行应用。由本文提出的聚类算法可以分为两个部分,第一部分是:通过相似性算法来衡量数据之间的相似度,第二部分是:根据第一部分的计算结果,再采用蚁群算法为需要聚类的数据选择不同的聚类中心,从而对不同属性的数据进行聚类,经过以上两个过程的计算,可以实现对数据的聚类。在本文中进行数据聚类时采用的相似性度量来代替距离的计算,是本文创新点之一,采用蚁群算法在聚类过程中来选择聚类中心也是本文的创新所在。  相似文献   

14.
王燕 《计算机工程与设计》2007,28(2):252-253,256
在进行聚类分析的时候,许多算法需要事先给出聚类类别数目.如果在不了解原始数据内部结构的情况下,很难给出合适的聚类类别数目.因此,通过对目前的聚类算法的研究,提出了一种聚类类别数目自动学习算法.算法在分析原始数据的内在分布的基础上,通过统计分布测试,能够准确的判断数据分裂的合理性,最终得到能充分拟合原始数据的聚类类别数目.实验证明算法是可行并且是有效的.  相似文献   

15.
基于异常的入侵检测方法难以有效地获得一个用于建立正常行为模式的正常数据训练集,而粒子群优化模糊聚类算法的初始化聚类数目一般凭经验确定,准确性不高。为此,提出一种自控粒子群优化模糊聚类算法。从网络数据中提取训练集,并初始化具有不同聚类数目的粒子群,在迭代过程中,根据不同粒子群的聚类有效性函数,通过列控制向量对各粒子群规模进行调整,由此实现聚合。实验结果表明,该方法的聚类结果准确率高,可以为基于异常的入侵检测方法提供可靠的训练数据。  相似文献   

16.
基于模糊粒度计算的K-means文本聚类算法研究   总被引:1,自引:1,他引:0  
传统的K-means算法对初始聚类中心非常敏感,聚类结果随不同的初始输入而波动,算法的稳定性下降。针对这个问题,提出了一种优化初始聚类中心的新算法:在数据对象的模糊粒度空间上给定一个归一化的距离函数,用此函数对所有距离小于粒度d_λ的数据对象进行初始聚类,对初始聚类簇计算其中心,得到一组优化的聚类初始值。实验对比证明,新算法有效地消除了传统K-means算法对初始输入的敏感性,提高了算法的稳定性和准确率。  相似文献   

17.
基于AHP和CRITIC综合赋权的K-means算法   总被引:1,自引:0,他引:1  
传统的K-means算法认为被分析样本的各个属性在聚类中作用是相同,针对这种不足,提出一种基于AHP和CRITIC综合赋权的K-means聚类算法.首先利用CV-K-means方法计算每个属性的权重,从而两两进行比较得到判断矩阵.然后,根据层次分析法(AHP)确定各个属性的主观权重,再利用CRITIC方法确定各个属性的客观权重.采用差异系数法确定组合系数,实验证明该算法的聚类精确度高于传统K-means算法.  相似文献   

18.
由于K—means聚类要求每个像素要和所有聚类中心求欧氏距离,因此当聚类数很多时,这是一个相当耗时的工作。改进后的K—means聚类算法使类内像素只通过和相邻的聚类中心进行距离计算来聚类,由于随着算法的迭代进行,大量类的状态基本固定,因此使得聚类速度不断加快。多层次聚类无损压缩就是利用改进的K—means聚类算法具有快速收敛的特点,和利用分层次去冗余的方法来聚类,因此可最大限度消除残差冗余。基于SP整数小波变换的多层次聚类由于其不仅能消除空间冗余、结构冗余,还能进一步对残差数据去冗余,因而实现了多光谱遥感图象无损压缩的突破。最后通过不同算法对TM图象进行压缩的比较和参数分析,论证了多层次聚类无损压缩的高效及合理性。  相似文献   

19.
谱聚类将数据聚类问题转化成图划分问题,通过寻找最优的子图,对数据点进行聚类。谱聚类的关键是构造合适的相似矩阵,将数据集的内在结构真实地描述出来。针对传统的谱聚类算法采用高斯核函数来构造相似矩阵时对尺度参数的选择很敏感,而且在聚类阶段需要随机确定初始的聚类中心,聚类性能也不稳定等问题,本文提出了基于消息传递的谱聚类算法。该算法采用密度自适应的相似性度量方法,可以更好地描述数据点之间的关系,然后利用近邻传播(Affinity propagation,AP)聚类中“消息传递”机制获得高质量的聚类中心,提高了谱聚类算法的性能。实验表明,新算法可以有效地处理多尺度数据集的聚类问题,其聚类性能非常稳定,聚类质量也优于传统的谱聚类算法和k-means算法。  相似文献   

20.
针对目前的曲线聚类算法基于类内差异设计,造成不同类之间的曲线区分度不高的问题。在曲线拟合、曲线距离界定的基础上,构造新的目标函数,提出同时考虑类内和类间差异的曲线聚类算法。模拟结果显示,该曲线聚类能够提高聚类精度;针对NO2污染物小时浓度的实例分析表明,该曲线聚类算法具有更好的类间区分度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号