首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出同时考虑真隶属度之差、假隶属度之差、得分值之差和清晰度之和的Vague值相似度量方法。将Vague聚类转化为经典模糊集聚类:先计算Vague对象两两之间的相似度,得到经典模糊相似矩阵,然后运用max-tΔ传递性进行聚类。这种聚类法计算更简单,丢失信息更少,聚类更准确。  相似文献   

2.
苏云辉 《福建电脑》2010,26(3):84-84,99
在Web日志挖掘中,存在两种类型的聚类:用户聚类和页面聚类。本文提出的Web用户群体和相关页面聚类算法,直接利用用户对页面的访问频率,如实体现用户的访问行为,具有较高的准确性,能够确定合理的聚类结果数目。其子类间的相对位置能反映出元素间相似程度的高低,还解决了聚类中普遍存在的子类间元素重复问题。  相似文献   

3.
文本聚类过程中,存在着文本数据空间维数巨大,聚类的数目不能直接确定等问题。为此,有专家学者提出了次胜者受罚的竞争学习(Rival Penalized Competitive Learning)算法,简称RPCL算法。该算法在一定程度上,解决了聚类的数目的确定问题。但是,该算法只适合做低维数据的聚类,对于高维数据聚类效果极差。该文提出了一种改进的RPCL算法,该方法不再采用欧氏距离去计算相似度,而是采用模糊相似度的方法,通过实验表明,改进的RPCL算法在聚类效果上好于经典的RPCL算法。  相似文献   

4.
Vague关系作为模糊关系的一种推广,在某些情况下,比直觉模糊关系具有更强的模糊信息表达能力。本文基于inax-t&min-s合成运算,将Yang和Shih的用于模糊关系的n步过程扩展到Vague关系上,扩展后的n步过程可以将相似Vague关系矩阵转换为等价Vague关系矩阵,进而提出了一种适用于所有max-t&min-s等价Vague关系矩阵的聚类算法。  相似文献   

5.
一种基于模糊聚类的隶属函数定义方法   总被引:1,自引:0,他引:1  
隶属函数的确定是模糊集合理论及其应用的基本而关键的问题。本文提出了一种基于模糊聚类的、以训练样本数据为依据的、自动地确定模糊集合隶属函数的方法,为开发模糊系统节省了大量的时间和精力。  相似文献   

6.
模糊K-Modes聚类精确度分析   总被引:4,自引:1,他引:4  
赵恒  杨万海 《计算机工程》2003,29(12):27-28,175
模糊K-Modes聚类算法是对具有分类属性的数据进行聚类的一种有效的算法。为了评价聚类结果,以具有明确分类结构的数据作为输入数据,将模糊K-Modes聚类结果与原始数据的分类结构进行对比,分析了确定它们之间对应关系的方法,在期望聚类结果应该具有的特点的基础上,对现有的精确度定义和计算方法进行修正,在划分相似度的基础上,重新定义模糊K-Modes聚类精确度。  相似文献   

7.
文本聚类是文本挖掘的一种重要方法.基于形式概念分析和概念相似度,给出一种新的多背景文本模糊聚类方法和模型.该方法不仅考虑了多背景关键词之间的语义关系,而且通过非距离计算得到模糊相似矩阵. 可根据不同要求得到相应的聚类结果,具有较好的灵活性.最后通过示例说明了所给算法的可行性.  相似文献   

8.
聚类分析是数据挖掘最常见的技术之一,数据的规模、维数和稀疏性都是制约聚类分析的不同方面.本文提出一种有效的高属性维稀疏数据聚类方法.给出稀疏相似度、等价关系的相似度、广义的等价关系的定义.基于对象间的稀疏相似度和等价关系原理形成初始等价类,通过等价关系的相似度修正初始等价关系,使得最终聚类结果更合理.该算法聚类过程不依赖于输入样本的排列顺序,高维稀疏数据的有效压缩提高算法在维数较高时的执行效率,适合于高维稀疏数据的聚类分析.  相似文献   

9.
首先提出了一种基于属性值的co-occurrence相似度概念,通过对其进一步的研究,提出了3个等价性表述;然后对属性值之间的co-occurrence相似度进行引申,给出了数据对象之间co-occurrence相似度的定义,并将其成功应用到聚类集成方法中。利用co-occurrence相似度在计算某个初始聚类结果中数据对象之间的相似度时,充分考虑了其他初始聚类结果和该初始聚类结果之间的相互影响和联系。实验表明, 基于co-occurrence相似度的聚类集成(CSCE)方法能有效识别数据之间的细微结构,有助于提高聚类集成的效果。  相似文献   

10.
对于时间序列的基因表达数据,传统的聚类算法都是以距离为相似性度量标准,没有考虑基因随时间变化的相似趋势。从基因变化的趋势出发,构造了一种新的模糊相似关系矩阵,提出了改进的基于模糊相似关系的聚类算法,并以该算法计算FCM的初始聚类中心。将该方法应用在酵母菌基因表达数据中,实验结果表明该算法不仅克服了FCM算法易陷入局部极小值、对初值敏感的缺点,而且能够发现一些表达模式变化趋势相似的共调控基因。  相似文献   

11.
针对于蚁群聚类算法在搬运数据项过程中随机选择移动位置时,由于无效移动导致的算法收敛速度缓慢等缺陷,论文提出了一种基于相似度的蚁群聚类算法.通过设计相似度矩阵,基于相似移动机制将蚂蚁随机移动方式优化为按照相似度矩阵规则实施目的性的关联.实验选取Iis、Wine、Haberman和Balance-scale四种经典数据集,相较于现有的LF算法及GACC算法,结果表明在蚂蚁空载率都为90%的条件下,论文提出的SMACC算法的迭代次数明显降低,均体现出较优的聚类速率.  相似文献   

12.
针对模糊聚类方法中存在冗余信息的问题,提出一种融合粗糙集属性约简和模糊等价关系的故障诊断方法,通过应用粗糙集属性约简算法对冗余数据的处理后再应用模糊等价关系聚类获取聚类结果。该方法与单采用模糊等价关系聚类法相比,不仅能够有效减少模糊等价关系矩阵求解中的迭代次数,而且获得聚类数也得到有效降低,并通过实例验证了该方法的有效性和高效性。  相似文献   

13.
用于Web文档聚类的基于相似度的软聚类算法   总被引:3,自引:1,他引:3  
提出了一种基于相似度的软聚类算法用于文本聚类,这是一种基于相似性度量的有效的软聚类算法,实验表明通过比较SISC和诸如K-mcans的硬聚类算法,SISC的聚类速度快、效率高。最后展望了文本挖掘在信息技术中的发展前景。  相似文献   

14.
传统的模糊等价关系聚类方法不能根据具体的约束条件进行聚类,使得聚类结果准确性低,不满足要求。为解决该问题,在传统方法的基础上,根据距离约束条件预处理数据集并且扩维,提出一种新的模糊聚类方法。通过数据间的Euclid距离以及约束条件为每个数据建立数据间关系,用来描述数据间的约束条件满足情况,同时将此作为数据的新增维度,更新原数据集并重新构建相似程度方程,获得对应的相似矩阵并基于模糊等价关系进行聚类。在真实数据集上的实验结果表明,与传统无指导的模糊等价关系聚类方法相比,提出的聚类方法克服了不能根据具体约束条件进行准确聚类的缺陷,具有更高的准确性。  相似文献   

15.
科学文献的模糊聚类算法   总被引:8,自引:0,他引:8  
林春燕  朱东华 《计算机应用》2004,24(11):66-67,70
针对科学文献的特点,以及人们在查询资料时主要使用关键词来进行查询的特征,提出了一种新的聚类方法。先对关键词进行聚类,由关键词的聚类结果直接映射得到文献的初始聚类,再根据文献的隶属度获得优化的聚类集。  相似文献   

16.
模糊聚类算法应用研究   总被引:2,自引:0,他引:2  
本文介绍了模糊C-均值聚类算法、遗传模糊C-均值聚类算法以及免疫进化模糊聚类算法的原理和应用,然后对其优缺点进行了分析比较.并给出了各自的适用领域。最后,总结了模糊聚类算法中存在的一些问题和发展前景。  相似文献   

17.
提出了一种高效的增量式模糊聚类算法。该算法仅对新增数据计算相似系数而直接聚类,其结果和广泛运用的传递闭包法、最大支撑树法等算法相同。  相似文献   

18.
提出一种优化传统协同聚类中模糊点类别归属的改进算法,该算法引入基于清晰半径的新相似性距离公式,用超球体中心区域代替传统算法中的类中心,在各子集初始聚类结果的基础上,对容易导致类别归属错误的模糊点重新计算隶属度,得到较为清晰的聚类结果。实验结果显示,改进算法能很大程度地减少边界上的模糊点个数及纠正分类错误,清晰半径的引入还能弱化各子集之间协同系数的差异,使得参数设置更为简单。  相似文献   

19.
模糊聚类是模式识别、机器学习和图像处理等领域的重要研究内容。模糊C-均值聚类算法是最常用的模糊聚类实现算法,该算法需要预先给定聚类数才能对数据集进行聚类。提出了一种新的聚类有效性指标,对聚类结果进行有效性验证。该指标从划分熵、隶属度、几何结构角度,定义了紧凑度、分离度、重叠度三个重要特征测量。在此基础上,提出了一种最佳聚类数确定方法。将新聚类有效性指标和传统有效性指标在6个人工数据集和3个真实数据集进行实验验证。实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合确定样本的最佳聚类数。  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号