首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
非均衡原型结构模式模糊聚类方法研究   总被引:1,自引:0,他引:1  
针对传统FCM算法通常只能检测大小近似相等呈球形或椭球分布的样本子集,而对样本结构、类型、密度分布不均衡的数据集聚类效果不理想等问题,提出一种基于原型初始化的样本隶属度分配方法.首先运用数学形态学理论对聚类原型初始化以获得模糊聚类的原型先验知识,在此基础上设计一种样本隶属分配方法进行样本聚类.理论分析和实验表明,该方法不但可以解决样本集内原型结构差异悬殊的数据集聚类问题,而且具有求解速度快、易于实现等优点.  相似文献   

2.
大多数现存的谱聚类方法均使用传统距离度量计算样本之间的相似性, 这样仅仅考虑了两两样本之间的相似性而忽略了周围的近邻信息, 更没有顾及数据的全局性分布结构. 因此, 本文提出一种新的融合欧氏距离和 Kendall Tau距离的谱聚类方法. 该方法通过融合两两样本之间的直接距离以及其周围的近邻信息, 充分利用了不同的相似性度量可以从不同角度抓取数据之间结构信息的优势, 更加全面地反映数据的底层结构信息. 通过与传统聚类算法在UCI标准数据集上的实验结果作比较, 验证了本文的方法可以显著提高聚类效果.  相似文献   

3.
大多数现存的谱聚类方法均使用传统距离度量计算样本之间的相似性,这样仅仅考虑了两两样本之间的相似性而忽略了周围的近邻信息,更没有顾及数据的全局性分布结构.因此,本文提出一种新的融合欧氏距离和Kendall Tau距离的谱聚类方法.该方法通过融合两两样本之间的直接距离以及其周围的近邻信息,充分利用了不同的相似性度量可以从不同角度抓取数据之间结构信息的优势,更加全面地反映数据的底层结构信息.通过与传统聚类算法在UCI标准数据集上的实验结果作比较,验证了本文的方法可以显著提高聚类效果.  相似文献   

4.
针对时间序列片段归类时在边界状态上存在不确定性的问题,提出一种软化边界的方法.该方法对时间序列记录集属性序列进行滑窗以及正规化处理后用模糊聚类方法聚类,使样本个体不是简单地归于单个代表形态.通过样本点的隶属度计算关联规则的支持度和可信度,使这2个重要指标的计算更精确,并采用一种基于隶属度的J-measure测度对规则有...  相似文献   

5.
提出同时考虑真隶属度之差、假隶属度之差、得分值之差和清晰度之和的Vague值相似度量方法.将Vague聚类转化为经典模糊集聚类:先计算Vague对象两两之间的相似度,得到经典模糊相似矩阵,然后运用max-t△传递性进行聚类.这种聚类法计算更简单,丢失信息更少,聚类更准确.  相似文献   

6.
针对模糊C均值(FCM)聚类算法没有考虑样本不同属性的重要程度、邻域信息等问题,提出一种基于熵与邻域约束的FCM算法。首先通过计算样本各属性的熵值来为各属性赋予权重,结合属性权重改进距离度量函数;随后根据邻域样本与中心样本间的距离计算邻域隶属度权重,加权得到邻域隶属度,利用邻域隶属度约束目标函数,修正隶属度迭代过程,最终达到提升FCM聚类算法性能的目的。理论分析和在人造数据集、多个UCI数据集的试验结果表明,改进后的算法在聚类效果、鲁棒性上均优于传统FCM算法、PCM算法、KFCM算法、KPCM算法和DSFCM算法,表明了本文算法的有效性。  相似文献   

7.
谱聚类是对样本拉普拉斯矩阵的特征向量进行聚类,不局限于原始数据的分布形状,可收敛于全局最优解,但不能准确反映样本间的实际关系,而模糊核聚类可利用模糊数学理论确定样本间的模糊关系。为此,在调整相似度度量函数和距离度量函数的基础上,将模糊核聚类融合到谱聚类算法中,提出SC-KFCM算法,利用模糊划分改进谱聚类中的硬划分,根据特征向量间的相似性和关联程度建立模糊隶属关系并对样本进行聚类,从而弥补谱聚类中硬划分部分对聚类结果造成的影响。实验结果表明,SC-KFCM算法在不同分布特点及维数的数据集上均取得了较稳定的聚类结果和较高的聚类精度。  相似文献   

8.
基于分类权与质心驱动的无监督学习算法   总被引:1,自引:0,他引:1  
为了充分挖掘隐藏在样本向量中的空间信息和知识信息: 用聚类点代替类均值, 把提取指标对聚类所做贡献的量化值定义为指标分类权; 用分类权定义样本点与聚类点的加权距离, 使之作为样本与类之间的相似性度量更具合理性, 即将加权距离转化为样本隶属度. 为了消除序贯算法产生的随机性, 用样本的K类隶属度作为点质量的样本质点组的质心, 修正当前的K类聚类点, 由此建立基于分类权和质心驱动的搜索聚类点的迭代算法. IRIS数据检验结果表明, 新算法的聚类效果与稳定性都优于已有的无监督学习方法.  相似文献   

9.
模糊支持向量机中隶属度的确定与分析   总被引:10,自引:1,他引:10       下载免费PDF全文
针对目前模糊支持向量机方法中,一般使用特征空间中样本与类中心之间的距离关系构建隶属度函数的不足,提出了一种新的有效地反映样本不确定性的隶属度计算方法——基于样本紧密度的隶属度方法。在确定样本的隶属度时,不仅考虑了样本与类中心之间的关系,还考虑了类中各个样本之间的关系,并采用模糊连接度来度量类中各个样本之间的关系。将其应用于模糊支持向量机方法中,较好地将支持向量与含噪声或野值样本区分开。实验结果表明,采用模糊支持向量机方法,其分类错误率比采用支持向量机方法的错误率低,在使用的3种隶属度函数中,采用基于紧密度隶属度的模糊支持向量机方法抗噪性能最好,分类性能最强。  相似文献   

10.
针对当前模糊支持向量机(FSVM)一般使用特征空间样本与类中心之间的距离构建隶属度函数的不足,首次利用熵的不确定性定量化度量特征和蚁群算法(ACO)的智能性与FSVM结合,提出一种基于熵和ACO的FSVM新方法(EAFSVM).求得的聚类中心和隶属度能更准确地反映数据本身的特点,提高测试精度.实验对比SVM和FSVM,结果表明EAFSVM测试精度较高.尤其对多类数据、大规模数据具有较好的分类能力.  相似文献   

11.
基于动态模糊联盟合作博弈的区间模糊Shapley值   总被引:2,自引:0,他引:2  
利用模糊数学相关理论,针对n人合作博弈中支付函数是模糊三角函数的情形,对经典Shapley值提出的三条公理进行了拓展,并构造了区间模糊Shapley值。考虑到盟友在合作结束后需要对具体的联盟收益进行分配,利用构造的区间模糊Shapley值隶属函数给出了确定的收益分配方案。最后利用实例对该方法的有效性和可行性进行了说明。  相似文献   

12.
针对基于粒子群的模糊聚类算法以隶属度编码时对噪音敏感,以及处理样本数小于样本维数的数据集效果较差等问题,通过改进其中的模糊聚类约束方法,提出一种改进的基于粒子群的模糊聚类方法.当样本对各类的隶属度之和不为1时,新方法在粒子群优化得出的隶属度基础上,根据样本与各类之间的距离对隶属度进一步分配,以使隶属度满足模糊聚类约束条件.新方法显著地改善了在隶属度编码下使用粒子群进行模糊聚类的效果,并通过典型的数据集进行了验证.  相似文献   

13.
模糊聚类辨识算法   总被引:10,自引:0,他引:10  
采用模糊输入聚类算法来辨识系统的模型,通过两个模糊聚类准则函数求得聚类中心和模糊规则数,然后求出各个子窨支态模型,再用隶属函数光滑地把他们连接成一个全局动态模糊模型,这种模型可以转化成状态空间模型,从而进行控制器的设计和稳定性分析。  相似文献   

14.
在矿山产能分配中,矿产品的大约利润、生产所需大约资源及提供生产的大约资源均为模糊数,综合模糊数学与模糊线性规划特点,建立基于结构元素的矿山产能分配的模糊线性规划预测模型。运用模糊结构元理论,将模型中用三角模糊数表达的模糊数用结构元表示,使模型中的参数的隶属函数得到解析表达,进而利用结构元加权序理论,将模型转为经典线性规划模型,实现对实际问题中的模糊事件的精确表达;且约束条件数目相对较少,简化了原模型求解,进而得到某矿山产能取得最大可能利润时的分配,可为决策者提供更精确信息。  相似文献   

15.
一种基于微粒群的模糊聚类算法   总被引:3,自引:0,他引:3       下载免费PDF全文
模糊聚类的FCM算法由于得不到各聚类的解析解,使其在某些应用中出现问题。为此,该文提出了一种基于微粒群理论的模糊聚类方法,利用微粒群自动调整各模糊聚类的中心点及其隶属函数参数,使模糊聚类符合数据分布特征,同时得到各聚类的隶属函数解析解。通过典型模糊分类问题,说明了该算法的有效性。  相似文献   

16.
Noise reduction by fuzzy image filtering   总被引:6,自引:0,他引:6  
A new fuzzy filter is presented for the noise reduction of images corrupted with additive noise. The filter consists of two stages. The first stage computes a fuzzy derivative for eight different directions. The second stage uses these fuzzy derivatives to perform fuzzy smoothing by weighting the contributions of neighboring pixel values. Both stages are based on fuzzy rules which make use of membership functions. The filter can be applied iteratively to effectively reduce heavy noise. In particular, the shape of the membership functions is adapted according to the remaining noise level after each iteration, making use of the distribution of the homogeneity in the image. A statistical model for the noise distribution can be incorporated to relate the homogeneity to the adaptation scheme of the membership functions. Experimental results are obtained to show the feasibility of the proposed approach. These results are also compared to other filters by numerical measures and visual inspection.  相似文献   

17.
In this paper we describe a color image segmentation system that performs color clustering in a color space and then color region segmentation in the image domain. For color segmentation, we developed a fuzzy clustering algorithm that iteratively generates color clusters using a uniquely defined fuzzy membership function and an objective function for clustering optimization. The fuzzy membership function represents belief value of a color belonging to a color cluster and the mutual interference of neighboring clusters. The region segmentation algorithm merges clusters in the image domain based on color similarity and spatial adjacency. We developed three different methods for merging regions in the image domain. Unlike many existing clustering algorithms, the image segmentation system does not require the knowledge about the number of the color clusters to be generated at each stage and the resolution of the color regions can be controlled by one single parameter, the radius of a cluster. The color image segmentation system has been implemented and tested on a variety of color images including satellite images, car and face images. The experiment results are presented and the performance of each algorithm in the segmentation system is analyzed. The system has shown to be both effective and efficient.  相似文献   

18.
K-means和模糊C均值为代表的划分式聚类算法无法有效处理按照风格为标准划分样本的聚类任务.针对此问题,文中提出按风格划分数据的模糊聚类算法.利用风格标准化矩阵表示包含在类簇中样本的风格信息,同时使用逼近标准风格之后的样本计算距离矩阵,并以隶属度表示样本点对于类簇的可代表程度.通过常用的交替优化策略同时优化隶属度矩阵和风格标准化矩阵.文中算法可以有效利用样本的风格信息和样本点与类簇之间的关系信息,在人工数据集和真实数据集上的实验表明算法的有效性.  相似文献   

19.

In the fields of pattern recognition and machine learning, the use of data preprocessing algorithms has been increasing in recent years to achieve high classification performance. In particular, it has become inevitable to use the data preprocessing method prior to classification algorithms in classifying medical datasets with the nonlinear and imbalanced data distribution. In this study, a new data preprocessing method has been proposed for the classification of Parkinson, hepatitis, Pima Indians, single proton emission computed tomography (SPECT) heart, and thoracic surgery medical datasets with the nonlinear and imbalanced data distribution. These datasets were taken from UCI machine learning repository. The proposed data preprocessing method consists of three steps. In the first step, the cluster centers of each attribute were calculated using k-means, fuzzy c-means, and mean shift clustering algorithms in medical datasets including Parkinson, hepatitis, Pima Indians, SPECT heart, and thoracic surgery medical datasets. In the second step, the absolute differences between the data in each attribute and the cluster centers are calculated, and then, the average of these differences is calculated for each attribute. In the final step, the weighting coefficients are calculated by dividing the mean value of the difference to the cluster centers, and then, weighting is performed by multiplying the obtained weight coefficients by the attribute values in the dataset. Three different attribute weighting methods have been proposed: (1) similarity-based attribute weighting in k-means clustering, (2) similarity-based attribute weighting in fuzzy c-means clustering, and (3) similarity-based attribute weighting in mean shift clustering. In this paper, we aimed to aggregate the data in each class together with the proposed attribute weighting methods and to reduce the variance value within the class. Thus, by reducing the value of variance in each class, we have put together the data in each class and at the same time, we have further increased the discrimination between the classes. To compare with other methods in the literature, the random subsampling has been used to handle the imbalanced dataset classification. After attribute weighting process, four classification algorithms including linear discriminant analysis, k-nearest neighbor classifier, support vector machine, and random forest classifier have been used to classify imbalanced medical datasets. To evaluate the performance of the proposed models, the classification accuracy, precision, recall, area under the ROC curve, κ value, and F-measure have been used. In the training and testing of the classifier models, three different methods including the 50–50% train–test holdout, the 60–40% train–test holdout, and tenfold cross-validation have been used. The experimental results have shown that the proposed attribute weighting methods have obtained higher classification performance than random subsampling method in the handling of classifying of the imbalanced medical datasets.

  相似文献   

20.
提出了一种基于对偶树复小波变换的模糊纹理图像分割算法,该方法包括纹理特征提取和纹理分类两个阶段,其中,特征提取在对偶树复小波变换的基础上进行;纹理分类可以直接用模糊C均值算法进行聚类从而完成纹理的分割,但由于该算法中隶属度函数是基于样本到类中心的距离设计的,这对非球形分布数据很不合理,针对该问题,引入样本与样本的紧致度来度量类中各个样本之间的关系从而修正隶属度函数,并将其用于纹理分类。实验结果表明与模糊C均值算法在运行时间上相差不大的情况下,改进的方法在分割精度、边缘准确性和区域一致性上都得到了明显的改善。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号