首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 875 毫秒
1.
典型的文本聚类算法是一种硬划分,但是实际上由于中文文本的多样性和大量性更适合进行软划分,模糊集理论的提出为这种软划分提供了有力的分析工具。传统的模糊聚类方法大都是通过对隶属度的矩阵逐步迭代得到模糊等价矩阵或模糊划分的方法实现聚类,这个过程需要大量的存储空间。基于模糊粒度计算的文本聚类算法是在文档集合的模糊粒度空间上给定一个归一化的距离函数ddi,dj),对距离小于粒度dλ的文本进行动态聚类。通过实验证明此方法在解决文本聚类问题时具有降低计算复杂度和空间复杂度,适于大量文本的聚类处理。  相似文献   

2.
基于模糊等价矩阵的聚类方法是模糊聚类中一种经典的分析方法。首次将其引入无线传感器节点分区的应 用中。该聚类分区算法通过计算节点间的Euclid距离、分析其相关性、形成模糊等价矩阵、进行节点分区,实现了对 该分区算法的应用设计。分析了其算法时间复杂度,并利用Matlab软件完成了算法仿真。仿真结果显示,该算法可 以根据其疏密程度的不同很好地将无线传感节点分成不同区域。  相似文献   

3.
1 引言在模糊聚类分析的研究与应用中,基于模糊关系等价闭包的模糊聚类算法,又称等价闭包法是一种重要的方法。等价闭包法即是利用样本间的模糊相似关系矩阵进行模糊矩阵相乘得到模糊等价矩阵进而得到等价闭包矩阵,选取适当的阈值对闭包矩阵截取得到一定的分类。该算法的关键问题就是计算出等价闭包矩阵。设R为模糊相似矩阵,其等价闭包矩阵由下式计算:  相似文献   

4.
近年来谱聚类算法在模式识别和计算机视觉领域被广泛应用,而相似性矩阵的构造是谱聚类算法的关键步骤。针对传统谱聚类算法计算复杂度高难以应用到大规模图像分割处理的问题,提出了区间模糊谱聚类图像分割方法。该方法首先利用灰度直方图和区间模糊理论得到图像灰度间的区间模糊隶属度,然后利用该隶属度构造基于灰度的区间模糊相似性测度,最后利用该相似性测度构造相似性矩阵并通过规范切图谱划分准则对图像进行划分,得到最终的图像分割结果。由于区间模糊理论的引入,提高了传统谱聚类的分割性能,对比实验也表明该方法在分割效果和计算复杂度上都有较大的改善。  相似文献   

5.
K-means和模糊C均值为代表的划分式聚类算法无法有效处理按照风格为标准划分样本的聚类任务.针对此问题,文中提出按风格划分数据的模糊聚类算法.利用风格标准化矩阵表示包含在类簇中样本的风格信息,同时使用逼近标准风格之后的样本计算距离矩阵,并以隶属度表示样本点对于类簇的可代表程度.通过常用的交替优化策略同时优化隶属度矩阵和风格标准化矩阵.文中算法可以有效利用样本的风格信息和样本点与类簇之间的关系信息,在人工数据集和真实数据集上的实验表明算法的有效性.  相似文献   

6.
传统的模糊方法已无法解决数据本身不确定性的问题,犹豫模糊集方法却行之有效.原有的犹豫模糊层次聚类算法没有考虑犹豫模糊集对权值的影响,缺乏合理的权重计算方法,并且算法的时间复杂度和空间复杂度都为指数级.为了更有效地解决聚类分析问题,本文提出一种凝聚中心犹豫度恒定的模糊层次聚类算法(FHCA),首先设计了一种基于数据集本身信息的权重公式,可以得到更加合理的权重分配.此外还提出了新的簇中心的计算公式,不仅使聚类过程中,簇中心的犹豫度具有不变性,还将原有算法的时间复杂度以及空间复杂度从指数级降至线性级,并且聚类的质量不劣于原有的聚类算法.  相似文献   

7.
聚类就是按照事物间的相似性进行区分和分类的过程,传统的聚类分析是一种硬划分,它把每个待辨识的对象严格地划分到某个类中,具有非此即彼的性质,因此这种分类的类别界限是分明的。而实际上大多数对象并没有严格的属性,它们在形态和类属方面存在着中介性,适合进行软划分。1965年,模糊理论的创始人Zadeh提出的模糊集理论为这种软划分提供了有力的分析工具,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类。该文主要内容是研究和实现基于等价关系的模糊聚类算法,该算法以隶属度作为聚类的出发点,以模糊等价矩阵作为启发规则。首先根据给出的样本,通过数据标准化求得数据矩阵;其次根据数量积法对数据矩阵进行标定即建立模糊相似矩阵;再次通过传递闭包法把模糊相似矩阵转换成模糊等价矩阵,在模糊等价矩阵中取不同的元素作为阈值λ,再根据λ截矩阵的定义把模糊等价矩阵转换成只有0和1的矩阵;最后,把该矩阵中元素相同的列聚为同一类。通过实例分析运用基于等价关系的模糊聚类算法进行聚类结果是正确的。  相似文献   

8.
基于MATLAB的模糊聚类分析的传递方法   总被引:5,自引:1,他引:5  
聚类分析中的传递方法是直接通过模糊相似矩阵获得动态聚类图,该方法比通过传递闭包法求模糊等价矩阵而获得动态聚类图的方法在时间复杂度和空间复杂度要小,本文对重点介绍传递方法,并给出了由MATLAB语言实现的算法程序,并介绍了一个应用实例。  相似文献   

9.
刘白  周永权  谢竹诚 《计算机应用》2009,29(6):1569-1571
针对传统的模糊C-均值(FCM)聚类算法的聚类有效性对空间样本分布的依赖性等缺点,提出了一种新的基于人工鱼群算法的动态模糊聚类。通过引入模糊等价矩阵来表示高维样本之间的相似程度,并将高维样本映射到二维平面。然后利用人工鱼群算法不断优化二维样本的坐标值,使样本之间的欧氏距离向样本间的模糊等价矩阵趋近,最终实现模糊聚类。该方法克服了聚类有效性对高维样本空间分布的依赖性并同时提高了效率。仿真实验结果证明了该算法是有效的,具有聚类速度快、精度高等特点。  相似文献   

10.
模糊聚类方法可以更有效地对复杂数据集进行分析,由于模糊聚类算法的种类繁多且聚类结果会随着输入的聚类个数的不同而改变,使得模糊聚类算法产生的结果不准确,因此,要获得准确的聚类结果必须确定模糊聚类个数k.目前已有的研究主要是利用多种模糊聚类有效性指标来确定最优聚类个数k,但是诸如SSD,PBM等模糊聚类指标会随着划分的聚类个数k的增加而单调递减,导致聚类个数k不准确.为此,文中提出了一种结合多目标优化算法的模糊聚类有效性指标(A Validity Index of Fuzzy Clustering Combined with Multi-obj ective Optimization Algorithm,OSACF),将模糊聚类度量指标与多目标优化算法(Multi-Obj ective Optimization Algorithm,MOEA)相结合来解决聚类最优个数k的问题.与使用聚类有效性指标不同,OSACF通过建立聚类个数k与聚类度量指标之间的双目标模型并使用MOEA优化该双目标模型来确定最优聚类个数k,避免了聚类有效性指标趋于单调递减的影响.另一方面,OSACF使用形态形似距离替代传统的欧氏距离度量,避免了聚类形状对计算聚类k值的影响.实验结果表明,OSACF结合MOEA得到的最优模糊聚类个数k比已有的聚类有效性指标获得的结果更准确.  相似文献   

11.
由于人们对事物认知的局限性和信息的不确定性,在对决策问题进行聚类分析时,传统的模糊聚类不能有效解决实际场景中的决策问题,因此有学者提出了有关犹豫模糊集的聚类算法。现有的层次犹豫模糊K均值聚类算法没有利用数据集本身的信息来确定距离函数的权值,且簇中心的计算复杂度和空间复杂度都是指数级的,不适用于大数据环境。针对上述问题,文中提出了一种基于密度峰值思想的加权犹豫模糊聚类算法(WHFDP),首先给出了犹豫模糊元素集的补齐方法,并结合变异系数理论给出了新的距离函数权重计算公式,然后利用密度峰值选取簇中心,不仅降低了簇中心计算的复杂度,而且提高了对不同规模以及任意形状数据集的适应性,算法的时间复杂度和空间复杂度也降为多项式级,最后采用典型数据集进行仿真实验,证明了所提算法的有效性。  相似文献   

12.
Recently, the Hesitant Fuzzy Linguistic Term Sets (HFLTSs) have been widely used to address cognitive complex linguistic information because of its advantage in representing vagueness and hesitation in qualitative decision-making process. Information measures, including distance measure, similarity measure, entropy measure, inclusion measure and correlation measure, are used to characterize the relationships between linguistic elements. Many decision-making theories are based on information measures. Up to now, distance, similarity, entropy and correlation measures have been proposed by scholars but there is no paper focuses on inclusion measure. This paper dedicates to filling this gap and the inclusion measure between HFLTSs are proposed. We discuss the relationships among distance, similarity, inclusion and entropy measures of HFLTSs. Given that clustering algorithm is an important application of information measures but there are few papers related to clustering algorithm based on information measures in the environment of HFLTS, in this paper, we propose two clustering algorithms based on correlation measure and distance measure, respectively. After that, a case study concerning water resource bearing capacity is illustrated to verify the applicability of the proposed clustering algorithms.  相似文献   

13.
将高维的大数据集随机分成若干个子集,对每个子集聚类采用一种基于遗传算法的高维数据模糊聚类方法。该方法引入了一个模糊非相似矩阵来表示高维样本之间的非相似程度,并将高维样本随机初始化到二维平面,利用遗传算法迭代优化二维样本的坐标值,实现二维样本之间的欧氏距离向样本间的模糊非相似度的趋近。将得到的最优的二维样本用模糊C-均值聚类(FCM)算法聚类,克服了聚类有效性对高维样本空间分布的依赖。实验仿真表明,该算法有较好的聚类效果,且极大地提高了聚类的速度。  相似文献   

14.
模糊C-均值算法在直觉模糊数聚类中的应用   总被引:5,自引:0,他引:5       下载免费PDF全文
提出了直觉模糊数的非监督模糊C-均值聚类算法。该算法首先定义了直觉模糊数之间的距离,其次构造了直觉模糊数聚类问题的目标函数,最后得到了直觉模糊数聚类的模糊C-均值聚类算法,聚类中心初始化方法,以及相关的聚类有效性函数。实验结果表明,该算法是有效的。  相似文献   

15.
王治和  王淑艳  杜辉 《计算机工程》2021,47(5):88-96,103
模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征。提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法。通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题。在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数。基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度。  相似文献   

16.
基于直觉模糊等价相异矩阵的聚类方法   总被引:4,自引:0,他引:4  
针对直觉模糊集合数据的聚类问题,提出了一种基于直觉模糊等价相异矩阵的聚类方法。该方法首先给出直觉模糊相异区间的概念,并构建了直觉模糊相异矩阵;然后定义了直觉模糊等价相异矩阵和(α,β)截矩阵,进而给出直觉模糊聚类算法;最后将其应用于目标编群领域,通过实例验证该算法的有效性。  相似文献   

17.
给出了关于传递闭包模糊聚类算法与在t1范数下利用模糊矩阵聚类方法的一些理论结果,同时解决了在t1范数下利用模糊矩阵聚类的方法中难于确定等价类的问题,从而给出了一种基于t1范数的聚类算法与应用结果。最后给出了基于max—t1范数与max—t3范数下利用模糊矩阵聚类方法间关系的讨论。  相似文献   

18.
刘怡俊  龙锦涛  杨晓君 《计算机应用研究》2023,40(4):1246-1249+1274
针对传统模糊聚类算法对初始聚类中心非常敏感以及对高光谱图像处理效果不佳的问题,为减少聚类数据的复杂度、降低聚类过程的计算成本以提升聚类性能,提出了一种基于多层二部图的高光谱模糊聚类算法。首先使用SuperPCA预处理方法对超像素分割得到的每个同质区域进行PCA来学习HSI数据不同区域的固有低维特征,从而获得高光谱数据的低维表示;其次,构造一个多层二部图矩阵来描述数据点和锚点之间的关系,降低了计算复杂度;最后,在模糊聚类中加入基于多层二部图的非负正则项来约束模糊隶属度矩阵的解空间。在Indian Pines和Pavia University数据集上进行的实验表明,所提算法能提高聚类效果与性能。  相似文献   

19.
针对模糊C-均值聚类算法过度依赖初始聚类中心的选取,从而易受孤立点和样本分布不均衡的影响而陷入局部最优状态的不足,提出一种基于自适应权重的模糊C-均值聚类算法。该算法采用高斯距离比例表示权重,在每一次迭代过程中,根据当前数据的聚类划分情况,动态计算每个样本对于类的权重,降低了算法对初始聚类中心的依赖,减弱了孤立点和样本分布不均衡的影响。实验结果表明,该算法是一种较优的聚类算法,具有更好的健壮性和聚类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号