首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
模糊聚类算法在汉语文本聚类中的应用   总被引:8,自引:2,他引:8  
应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。  相似文献   

2.
针对模糊C-均值聚类算法过度依赖初始聚类中心的选取,从而易受孤立点和样本分布不均衡的影响而陷入局部最优状态的不足,提出一种基于自适应权重的模糊C-均值聚类算法。该算法采用高斯距离比例表示权重,在每一次迭代过程中,根据当前数据的聚类划分情况,动态计算每个样本对于类的权重,降低了算法对初始聚类中心的依赖,减弱了孤立点和样本分布不均衡的影响。实验结果表明,该算法是一种较优的聚类算法,具有更好的健壮性和聚类效果。  相似文献   

3.
动态加权模糊核聚类算法   总被引:2,自引:0,他引:2  
为了克服噪声特征向量对聚类的影响,充分考虑各特征向量对聚类结果的贡献度的不同,运用mercer核将待聚类的数据映射到高维空间,提出了一种新的动态加权模糊核聚类算法.该算法运用动态加权,自动消弱噪声特征向量在分类中的作用,在对数据没有任何先验信息的情况下,不仅能够准确划分线性数据,而且能够做到非线性划分非团状数据.仿真和实际数据分类结果表明,数据中的噪声对分类结果影响较小,该算法具有很高的实用性.  相似文献   

4.
粗糙的方向性模糊聚类算法   总被引:1,自引:0,他引:1  
根据高维数据具有方向性的特征,结合概率模糊聚类算法与粗糙集理论提出了一种粗糙的方向性模糊聚类算法。该算法在概率模糊聚类算法中引入了数据方向相似性函数,能对不确定数据进行处理。在算法中利用粗糙集中的下近似集与边界集来确定目标对象函数,属于下近似集的数据在聚类时是确定的,属于边界的数据具有模糊性。实验结果表明,该算法能有效地对高维的方向性数据进行聚类。  相似文献   

5.
基于划分的模糊聚类算法   总被引:68,自引:1,他引:67       下载免费PDF全文
张敏  于剑 《软件学报》2004,15(6):858-868
在众多聚类算法中,基于划分的模糊聚类算法是模式识剐中最常用的算法类型之一.至今,献中仍不断有关于基于划分的模糊聚类算法的研究成果出现.为了能更为系统和深入地了解这些聚类算法及其性质,本从改变度量方式、改变约束条件、在目标函数中引入熵以及考虑对聚类中心进行约束等几个方面,对在C-均值算法的基础上得到的基于划分的模糊聚类算法作了综述和评价,对各典型算法的优缺点进行了实验比较分析.指出标准FCM算法被广泛应用的原因之一是它对数据的比例变化具有鲁棒性,而其他类似的算法对这种比例变化却很敏感.并以极大熵方法为例进行了比较实验.最后总结了基于划分的模糊聚类算法普遍存在的问题及其发展前景。  相似文献   

6.
基于清晰半径的模糊点二次聚类算法   总被引:1,自引:0,他引:1  
高翠芳  胡权 《计算机应用》2013,33(2):547-582
针对模糊C-均值(FCM)聚类算法在模糊边界上容易出现划分错误的问题,提出一种对模糊点进行二次处理的改进算法。该算法以各类中的数据分布密度为依据,首先利用清晰点构成超球体中心区域,然后基于中心区域的清晰半径定义一种新的相似性距离,并利用该距离对模糊点的隶属度进行二次计算,重新确定其类别归属。实验结果显示,改进算法能有效纠正分类错误,提高模糊点的清晰度,在密度差异较大的数据集上具有一定的应用潜力。  相似文献   

7.
在网格的研究中,网格资源的合理选择和充分利用是网格技术追求的目标,为了更为有效的解决网格资源的选择,本文提出了一种基于模糊聚类和属性权重的资源选择方法。它以模糊聚类为基础,根据资源各属性对具体网格应用的重要度确定属性权重。最后确定资源分类。文章最后以一个具体实例说明该方法的资源分类过程。  相似文献   

8.
FCM聚类算法中模糊加权指数m的优化   总被引:3,自引:0,他引:3  
研究模糊加权指数m对FCM(Fuzzy c-means)算法的聚类性能的影响,从划分熵入手提出了变权划分熵的概念,并基于模糊决策理论提出了一种最优加权指数m*的选取方法.该方法利用小的目标函数值和小的变权划分熵对应好的数据分类结果这一特性,将m的确定转化为一个带约束的非线性规划问题,从而确定最佳取值m*.实验结果表明该方法是非常有效和灵敏的.  相似文献   

9.
在现实应用中,一些关系数据的规范化程度不高,往往存在数据冗余和不一致现象。为了有效评估此类数据中的属性重要程度,提出了一种基于近似函数依赖的属性权重评估方法。该方法基于一致集的概念导出最大集,生成最小非平凡函数依赖集,从而找出属性之间的近似函数依赖关系,进而求出近似候选码和近似关键字,在此基础上根据属性支持度计算属性权重。实验结果和分析表明,提出的属性权重评估方法能够合理地获取关系数据中的属性重要程度,算法具有较好的稳定性和较高的执行效率。  相似文献   

10.
针对传统多机多目标攻击不易解算攻击任务分配;且计算量大的问题;提出基于划分的多目标模糊聚类算法;该算法根据目标属性的相似性进行多目标分类;可以有效地降低多目标任务分配解算维数;减少运算量;提高解算速度。采用FCM算法以及改进FCM算法度量方式构成的其他各个不同算法;建立空战多目标模糊聚类数学模型;对两组不同数据进行仿真分析;得到不同情况下的各算法的优劣性及适用性。  相似文献   

11.
聚类分析中PAM算法的分析与实现   总被引:8,自引:2,他引:6  
首先详细讨论了PAM算法,包括:PAM算法的基本思想,如何替换中心点增进聚类质量,PAM算法的处理流程,代价函数的计算.相异度的计算.复杂度分析等.然后给出了一个实现PAM算法的实例。  相似文献   

12.
In the real world, there exist a lot of fuzzy data which cannot or need not be precisely defined. We distinguish two types of fuzziness: one in an attribute value itself and the other in an association of them. For such fuzzy data, we propose a possibility-distribution-fuzzy-relational model, in which fuzzy data are represented by fuzzy relations whose grades of membership and attribute values are possibility distributions. In this model, the former fuzziness is represented by a possibility distribution and the latter by a grade of membership. Relational algebra for the ordinary relational database as defined by Codd includes the traditional set operations and the special relational operations. These operations are classified into the primitive operations, namely, union, difference, extended Cartesian product, selection and projection, and the additional operations, namely, intersection, join, and division. We define the relational algebra for the possibility-distribution-fuzzy-relational model of fuzzy databases.  相似文献   

13.
    
Alina Momot 《Expert Systems》2012,29(4):347-358
Averaging in the time domain may be used for noise attenuation in case of biomedical signals with a quasi‐cyclical character. Traditional arithmetic averaging technique assumes the constancy of the noise power cycle‐wise, however, most types of noise are not stationary and the variability of noise power is observed. It constitutes a motivation for using methods of weighted averaging, in particular Bayesian weighted averaging. This paper presents the computational study of Bayesian weighted averaging with traditional (sharp) and fuzzy partition of the input data in the presence of non‐stationary noise. There is presented the known empirical Bayesian weighted averaging method (EBWA), with the parameter p describing the probabilistic model, and its modification NBWA which eliminates the parameter. Both methods can be extended by partitioning of the input data. The performance of presented methods is experimentally evaluated for an analytical signal as well as a real ECG signal and compared with traditional arithmetic averaging method. However, the methods can be applied to any signal with a quasi‐cyclical character. The aim of the paper is to show the influence of the type of partition as well as the number of parts on the quality of the averaged signal.  相似文献   

14.
模糊关系数据库查询语言FSQL   总被引:1,自引:0,他引:1  
模糊数据库是模糊信息处理系统的重要组成部分。本文以SQL语言为基础,设计了模糊关系数据库查询语言FSQL。FSQL语言采用了模糊值模糊关系数据模型,提供了相应的模糊数据定义与模糊数据操纵功能。为了便于模糊信息的表示和管理,FSQL语言增加了模糊数据类型,如简单标量型、模糊标量型、简单数集、模糊数集等。另外,为了便于模糊查询,扩充了模糊比较库函数及自定义隶属函数。  相似文献   

15.
    
  相似文献   

16.
基于记录分区的加权关联规则挖掘   总被引:5,自引:0,他引:5  
提出了基于记录分区的加权关联规则的定理和算法,利用反倾斜技术,在合理的内存支持下,该算法至多2次扫描交易数据库;同时,该算法不必根据k-支持期望进行修剪,因而本文算法是有效、可行的。  相似文献   

17.
模糊聚类是数据挖掘中一个重要聚类算法。当前,基于数据流模型的聚类算法已有了广泛的研究,但这些算法均为硬聚类,尚未见数据流上进行模糊聚类的文献。提出一种针对数据流模型的加权模糊聚类算法,基于真实数据集合和人工数据集的实验表明该算法比传统的模糊聚类算法具有更好的聚类性能。  相似文献   

18.
    
Fuzzy weighted arithmetic average or fuzzy weighted average (FWA) for short has been deeply studied. However, no attention has been paid to other fuzzy weighted means such as fuzzy weighted geometric mean (FWGM), fuzzy weighted harmonic mean (FWHM) and the like. This paper presents a very general fuzzy weighted mean, which we refer to as generalised fuzzy weighted mean (GFWM). It includes FWA, FWGM, FWHM, fuzzy weighted quadratic mean (FWQM) and fuzzy weighted root-power mean (FWRM) as its special cases. Linear programming models for solving GFWM and its special cases are developed and the order relationships among FWA, FWGM and FWHM are investigated. Numerical examples that illustrate the computational processes of FWA, FWGM and FWHM are provided and their order relationships are numerically examined.  相似文献   

19.
为使关系数据库系统具备处理动态模糊数据的能力,将动态模糊理论和关系数据库理论相结合,通过分析面向动态模糊数据的关系数据库系统的功能,构造了该数据库的系统结构,探讨了实现该数据库的方法,对面向动态模糊数据的关系数据库系统做了初步的研究。  相似文献   

20.
针对大规模项目资源库中项目资源信息无序而导致无法准确快速找出项目资源库中所需资源的问题,提出了基于MapReduce的并行化模糊聚类划分算法。该算法首先抽象原始项目资源特征属性并标准化;其次,根据标准化后的特征属性建立项目相似矩阵,运用矩阵分块思想分割矩阵;然后,利用MapReduce技术处理分块矩阵并合并结果;最后,运用阈值评判划分成若干个有序的项目组。与K-means算法和遗传算法的对比实验结果证明:该算法具有较高的准确率和查全率,并且在大规模数据计算时能够得到较高的加速比,可以有效准确地划分项目资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号