首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于模糊C均值(FCM)和局部自适应聚类(LAC)提出一种针对高维数据的联机局部自适应模糊C均值聚类算法(OLAFCM).OLAFCM通过为各类属性分别赋以相应的局部权重,使各类属性分布在不同属性组合的张量子空间内,从而有效降低采用全局降维方法造成的信息损失,同时适合聚类数据流.最后,在人工模拟和真实数据集上验证OLAFCM比之现有基于全局降维的划分联机聚类算法具有更好的性能.  相似文献   

2.
针对非充分数据集及噪声对聚类分析的干扰,基于模糊C均值(FCM)框架下的聚类技术,即一般化的增强模糊划分聚类算法(GIFP-FCM),探讨具有迁移学习能力的聚类方法--融入迁移学习机制的GIFP-FCM算法(T-GIFP-FCM)。该算法通过有效利用历史相关场景(域)总结得到的知识来指导当前场景(域)中信息不足时的聚类任务,从而提高聚类效果。通过在模拟数据集及真实数据集上的仿真实验,结果显示文中算法较之传统算法在处理信息不足任务时具有更佳的性能。  相似文献   

3.
This study presents the application of fuzzy c-means (FCM) clustering-based feature weighting (FCMFW) for the detection of Parkinson's disease (PD). In the classification of PD dataset taken from University of California – Irvine machine learning database, practical values of the existing traditional and non-standard measures for distinguishing healthy people from people with PD by detecting dysphonia were applied to the input of FCMFW. The main aims of FCM clustering algorithm are both to transform from a linearly non-separable dataset to a linearly separable one and to increase the distinguishing performance between classes. The weighted PD dataset is presented to k-nearest neighbour (k-NN) classifier system. In the classification of PD, the various k-values in k-NN classifier were used and compared with each other. Also, the effects of k-values in k-NN classifier on the classification of Parkinson disease datasets have been investigated and the best k-value found. The experimental results have demonstrated that the combination of the proposed weighting method called FCMFW and k-NN classifier has obtained very promising results on the classification of PD.  相似文献   

4.
Fuzzy C-means (FCM) clustering has been widely used successfully in many real-world applications. However, the FCM algorithm is sensitive to the initial prototypes, and it cannot handle non-traditional curved clusters. In this paper, a multi-center fuzzy C-means algorithm based on transitive closure and spectral clustering (MFCM-TCSC) is provided. In this algorithm, the initial guesses of the locations of the cluster centers or the membership values are not necessary. Multi-centers are adopted to represent the non-spherical shape of clusters. Thus, the clustering algorithm with multi-center clusters can handle non-traditional curved clusters. The novel algorithm contains three phases. First, the dataset is partitioned into some subclusters by FCM algorithm with multi-centers. Then, the subclusters are merged by spectral clustering. Finally, based on these two clustering results, the final results are obtained. When merging subclusters, we adopt the lattice similarity method as the distance between two subclusters, which has explicit form when we use the fuzzy membership values of subclusters as the features. Experimental results on two artificial datasets, UCI dataset and real image segmentation show that the proposed method outperforms traditional FCM algorithm and spectral clustering obviously in efficiency and robustness.  相似文献   

5.
崔建  李强  刘勇 《计算机应用》2011,31(5):1348-1350
为提高数据库分类系统的分类精度,提出一种新的分类方法。首先,利用模糊C-均值聚类算法对数据库中的连续属性进行离散化;然后,在此基础上提出一种改进的模糊关联算法挖掘分类关联规则;最后,通过计算规则和模式之间的兼容性指标来构造特征向量,构建支持向量机的分类器模型。实验结果表明,该方法具有较高的分类识别能力和分类效率。  相似文献   

6.
针对于模糊c-均值(FCM)算法在初始聚类中心选取不佳的情况下容易产生聚类错误划分的情况,从FCM算法出发提出了一种基于笛卡尔乘积的FCM聚类算法(C-FCM),并分析了加权指数m对聚类分析的影响。C-FCM将聚类提高到更高维的空间,有效地避免了FCM 对初值敏感及容易陷入局部极小的缺陷。客运专线列控(TCC)评估测试项目对C-FCM的检验结果表明,与传统FCM算法相比,C-FCM算法更准确,效果更佳,对解决邻站数据包的划分问题是可行、有效的。  相似文献   

7.
基于二阶模糊聚类算法的雷达目标距离像识别   总被引:1,自引:0,他引:1  
彭翔  周代英 《计算机应用》2011,31(2):399-401
针对于模糊C-均值(FCM)算法敏感于聚类中心初始值的缺点,提出一种基于二阶模糊聚类方法。该方法利用传递闭包(TC)算法无初始化的优点,先对样本集按一定分类水平进行划分,选取若干类,求得这些类的样本均值作为FCM算法的初始聚类中心。一方面能够获得理想的聚类中心初始值,同时还能通过分类水平值来优化聚类中心数和聚类中心,避免局部最优,克服一致性聚类。利用该算法对三类飞机目标的实测一维距离像数据进行了识别实验,实验结果表明,基于二阶模糊聚类方法的识别率比FCM有了明显的改善。  相似文献   

8.
朱接文  肖军 《计算机应用》2014,34(9):2608-2611
针对大型数据中大量冗余特征的存在可能降低数据分类性能的问题,提出了一种基于互信息(MI)与模糊C均值(FCM)聚类集成的特征自动优选方法FCC-MI。首先分析了互信息特征及其相关度函数,根据相关度对特征进行排序;然后按照最大相关度对应的特征对数据进行分组,采用FCM聚类方法自动确定最优特征数目;最后基于相关度对特征进行了优选。在UCI机器学习数据库的7个数据集上进行实验,并与相关文献中提出的基于类内方差与相关度结合的特征选择方法(WCMFS)、基于近似Markov blanket和动态互信息的特征选择算法(B-AMBDMI)及基于互信息和遗传算法的两阶段特征选择方法(T-MI-GA)进行对比。理论分析和实验结果表明,FCC-MI不但提高了数据分类的效率,而且在有效保证分类精度的同时能自动确定最优特征子集,减少了数据集的特征数目,适用于海量、数据特征相关性大的特征约简及数据分析。  相似文献   

9.
针对DBN算法训练时间复杂度高,容易过拟合等问题,受模糊理论启发,提出了一种基于模糊划分和模糊加权的集成深度信念网络,即FE-DBN(ensemble deep belief network with fuzzy partition and fuzzy weighting),用于处理大样本数据的分类问题。通过模糊聚类算法FCM将训练数据划分为多个子集,在各个子集上并行训练不同结构的DBN,将每个分类器的结果进行模糊加权。在人工数据集、UCI数据集上的实验结果表明,提出的FE-DBN比DBN精度均有所提升,具有更快的运行时间。  相似文献   

10.
针对传统模糊C均值(FCM)聚类算法聚类数目难以确定,迭代速度慢,易陷入局部最优以及对聚类中心初始值的设置敏感等问题,提出一种融合全局最好和声搜索模糊C均值(GBHS-FCM)聚类算法。首先,利用全局最好和声搜索(GBHS)算法的全局性和鲁棒性的优点,得到初始聚类中心和聚类个数,再将其作为传统FCM聚类算法的初始聚类中心和聚类个数;其次,提出一种新颖的模糊聚类目标函数,将图像像素点邻域依赖特性考虑进来,与像素点灰度信息共同作用,增强了分割结果空间的连续性;此外,还采用了一种新颖的距离公式代替欧氏距离公式,增强了新算法对噪声的鲁棒性。仿真结果表明,新算法有效避免了传统FCM算法因初始聚类中心设置敏感而收敛到局部最优解,在聚类精度、速度和鲁棒性上均比传统FCM算法有所提高,针对具有不同特征的图像分割取得了较好的结果。  相似文献   

11.
一种模糊认知图分类器的研究*   总被引:3,自引:1,他引:2  
通过使用模糊认知图来模拟分类过程,构造了一种模糊认知图分类器,提出了它的两种模糊认知图分类模型,并在此基础上给出了使用它进行分类的推理机制。实验证明,该方法具有良好的分类性能。  相似文献   

12.
半监督聚类的若干新进展   总被引:6,自引:0,他引:6  
半监督聚类方法利用少量标记数据提高聚类算法的性能,已逐渐发展成为模式识别及相关领域的研究热点.文中首先综述了半监督聚类算法的一些新进展,包括基于约束的方法、基于距离的方法和基于距离与约束的融合方法.然后提出一种基于约束的半监督模糊C-means聚类算法.实验表明,该算法与传统的模糊C-means及半监督K-means方法相比,具有更好的聚类精度.  相似文献   

13.
One of the simple techniques for Data Clustering is based on Fuzzy C-means (FCM) clustering which describes the belongingness of each data to a cluster by a fuzzy membership function instead of a crisp value. However, the results of fuzzy clustering depend highly on the initial state selection and there is also a high risk for getting the best results when the datasets are large. In this paper, we present a hybrid algorithm based on FCM and modified stem cells algorithms, we called it SC-FCM algorithm, for optimum clustering of a dataset into K clusters. The experimental results obtained by using the new algorithm on different well-known datasets compared with those obtained by K-means algorithm, FCM, Genetic Algorithm (GA), Particle Swarm Optimization (PSO), Ant Colony Optimization (ACO), Artificial Bee Colony (ABC) Algorithm demonstrate the better performance of the new algorithm.  相似文献   

14.
一种协同的FCPM模糊聚类算法   总被引:1,自引:0,他引:1  
比重隶属度模糊聚类(FCPM)算法可从不同角度解决聚类问题,取得较好效果。协同聚类算法利用不同特征子集之间的协同关系,并与其它聚类算法相结合,可提高原有的聚类性能。文中在FCPM聚类算法的基础上进行改进,将其与协同聚类算法相结合,提出一种协同的FCPM聚类算法。该算法在原有FCPM聚类算法的基础上,提高对数据集的聚类效果。在对数据集Wine和Iris进行测试的结果表明,该方法优于FCPM算法,说明该方法的有效性。  相似文献   

15.
在综合分析标准的模糊C-均值聚类算法和条件模糊C-均值聚类算法基础上,对模糊划分空间进行修改,进一步弱化模糊划分矩阵的约束,给出一种扩展的条件模糊C-均值聚类算法。算法的划分矩阵和原型不依赖于背景约束及模糊划分矩阵的隶属度总和。实验结果表明:该算法可以得到不同的聚类原型,并具有很好的聚类效果。  相似文献   

16.
一种大数据环境中分布式辅助关联分类算法   总被引:4,自引:0,他引:4  
张明卫  朱志良  刘莹  张斌 《软件学报》2015,26(11):2795-2810
在很多现实的分类应用中,新数据的类标需要由领域专家最终确定,而分类器的分类结果仅起辅助作用.另外,随着大数据所隐含价值越发被人们重视,分类器的训练会从面向单一数据集逐渐过渡到面向分布式空间数据集,大数据环境下辅助分类也将成为未来分类应用的重要分支.然而,现有的分类研究缺乏对此类应用的关注.大数据环境中的辅助分类面临以下3个问题:1) 训练集是分布式大数据集;2) 在空间上,训练集所包含的各局部数据源的类别分布不尽相同;3) 在时间上,训练集是动态变化的,会发生类别迁移现象.在考虑以上问题的基础上,提出一种大数据环境中分布式辅助关联分类方法.该方法首先给出一种大数据环境中分布式关联分类器构建算法,在该算法中,通过横向加权考虑分类数据集在空间上的类别分布差异,并给出"前件空间支持度-相关系数"的度量框架,改进关联分类算法面对不平衡数据的性能缺陷;然后,给出一种基于适应因子的辅助关联分类器动态调整方法,能够在分类器应用过程中充分利用领域专家实时反馈的结果对分类器进行动态调整,以提升其面向动态数据集的分类性能,减缓分类器的退化和重新训练的频率.实验结果表明,该方法能够面向分布式数据集较快地训练出有较高分类准确率的关联分类器,并在数据集不断扩充变化时提升分类性能,是一种有效的大数据环境中辅助分类应用方法.  相似文献   

17.
一种协同的可能性模糊聚类算法   总被引:1,自引:0,他引:1  
模糊C-均值聚类(FCM)对噪声数据敏感和可能性C-均值聚类(PCM)对初始中心非常敏感易导致一致性聚类。协同聚类算法利用不同特征子集之间的协同关系并与其他算法相结合,可提高原有的聚类性能。对此,在可能性C-均值聚类算法(PCM)基础上将其与协同聚类算法相结合,提出一种协同的可能性C-均值模糊聚类算法(C-FCM)。该算法在改进的PCM的基础上,提高了对数据集的聚类效果。在对数据集Wine和Iris进行测试的结果表明,该方法优于PCM算法,说明该算法的有效性。  相似文献   

18.
In this paper, a new approach for fault detection and isolation that is based on the possibilistic clustering algorithm is proposed. Fault detection and isolation (FDI) is shown here to be a pattern classification problem, which can be solved using clustering and classification techniques. A possibilistic clustering based approach is proposed here to address some of the shortcomings of the fuzzy c-means (FCM) algorithm. The probabilistic constraint imposed on the membership value in the FCM algorithm is relaxed in the possibilistic clustering algorithm. Because of this relaxation, the possibilistic approach is shown in this paper to give more consistent results in the context of the FDI tasks. The possibilistic clustering approach has also been used to detect novel fault scenarios, for which the data was not available while training. Fault signatures that change as a function of the fault intensities are represented as fault lines, which have been shown to be useful to classify faults that can manifest with different intensities. The proposed approach has been validated here through simulations involving a benchmark quadruple tank process and also through experimental case studies on the same setup. For large scale systems, it is proposed to use the possibilistic clustering based approach in the lower dimensional approximations generated by algorithms such as PCA. Towards this end, finally, we also demonstrate the key merits of the algorithm for plant wide monitoring study using a simulation of the benchmark Tennessee Eastman problem.  相似文献   

19.
针对二元关联法(BR)未考虑标签之间相关性,容易造成分类器输出在训练集中不存在或次数较少标签的不足,提出了基于贝叶斯模型的多标签分类算法(MLBM)和马尔可夫型多标签分类算法(MMLBM)。首先,建立仿真模型分析BR算法的不足,考虑到标签的取值应由属性置信度和标签置信度共同决定,提出MLBM。其中,通过传统的分类算法计算获得属性置信度,以及通过训练集得到标签置信度。然后,考虑到MLBM在计算属性置信度时必须考虑所有已分类的标签,分类器的性能容易受无关或弱关系的标签影响,所以使用马尔可夫模型简化置信度的计算提出了MMLBM。理论分析和仿真实验表明,与BR算法相比,MMLBM的平均分类精度在emotions数据集上提高约4.8%,在yeast数据集上提高约9.8%,在flags数据集上提高约7.3%。实验结果表明,当数据集中实例的标签基数较大时,相对于BR算法,MMLBM的准确性有较大的提升。  相似文献   

20.
遥感影像数据因其固有的不确定性与复杂性,导致传统的无监督分类算法难以对其准确建模。基于模糊集理论的模式识别方法可以有效地表达数据的模糊性,其中二型模糊集能更好地刻画类间多重不确定性,而半监督法可以利用少量先验知识来解决算法对数据的泛化性问题,因此提出一种基于半监督的自适应区间二型模糊C均值遥感影像分类方法(SS-AIT2FCM)。首先,结合半监督和进化论思想,提出一种新的模糊权重指数选取方法,以提升自适应区间二型模糊C均值聚类算法的鲁棒性与泛化性,使算法更适用于光谱混叠严重、覆盖面积大、地物丰富的遥感数据分类;然后,通过对少量标记样本的软约束监督,对区间二型模糊算法迭代过程进行优化指导,来挖掘数据的最优表达。实验选用了北京颐和园区域的SPOT5多光谱遥感影像数据和广东横琴岛区域的Landsat TM多光谱遥感影像数据,对现有流行的模糊分类算法和SS-AIT2FCM的分类结果进行了比较。结果表明,SS-AIT2FCM获得了更高的分类精度与更清晰的类别边界,且有较好数据泛化能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号