共查询到19条相似文献,搜索用时 62 毫秒
1.
针对区间型数据的聚类问题,提出一种自适应模糊c均值聚类算法。该算法一方面基于区间数的中点和半宽度,通过引入区间宽度的影响因子以控制区间大小对聚类结果的影响;另一方面通过引入一个自适应系数,以减少区间型数据的数据结构对聚类效果的影响。通过仿真数据和Fish真实数据验证了该算法的有效性,并对聚类结果进行比较和分析。 相似文献
2.
针对区间数模糊c均值聚类算法存在模糊度指数m无法准确描述数据簇划分情况的问题,对点数据集合的区间Ⅱ型模糊c均值聚类算法进行拓展,将其扩展到区间型不确定数据的聚类中。同时,分析了区间数的区间Ⅱ型模糊c均值聚类算法的收敛性,以确定模糊度指数m1和m2的取值原则。基于合成数据和实测数据的仿真实验结果表明:区间数的区间Ⅱ型模糊c均值聚类算法比区间数的模糊c均值聚类算法的聚类效果好。 相似文献
3.
岳明道 《计算机工程与应用》2011,47(13):157-160
在传统模糊C-均值聚类算法的基础上,提出了一种新型区间值数据模糊聚类算法。运用区间分割策略改进了区间距离的计算公式,成功解决了区间距离计算方法存在的缺陷。提出了区间值数据模糊聚类的数学模型,并拓广模糊C-均值算法对区间值数据进行聚类。仿真验证了所提出算法的有效性。 相似文献
4.
针对区间型数据的模糊c均值聚类(IFCM)算法在实际应用中的不足,将可能性理论引入区间型数据的聚类问题,通过放松样本隶属度的约束条件和修正IFCM算法的目标函数,提出一种区间型数据的可能性聚类算法。通过仿真模拟实验和平均CR指标分析,结果表明:在包含噪声和孤立点等代表性比较差的样本数据的聚类问题中,该算法明显优于IFCM算法,能有效地降低噪声对聚类效果的影响。 相似文献
5.
对基于区间值数据的模糊聚类算法进行了研究,介绍了具有控制区间大小对聚类结果影响的加权因子的模糊C-均值聚类新算法.针对区间值数据模糊C-均值聚类新算法提出了一个适应距离的弹性系数,使算法得到改进,既能利用传统的FCM算法,又考虑了区间大小对聚类结果的影响,同时也能发现不规则的聚类子集,使聚类结果更加准确. 相似文献
6.
7.
基于属性权重区间监督的模糊C均值聚类算法 总被引:4,自引:0,他引:4
在加权模糊聚类算法中,属性权重确定的合理性是一个重要问题.鉴于用区间数描述决策者推理模糊性的优越性,提出属性权重用区间数表示,由区间层次分析法获得属性对聚类的贡献度,并以该区间为约束条件,提出了可同时获得属性权重和聚类结果的模糊C均值聚类新算法.实验结果表明,该算法以决策者的经验和偏好为监督,可避免迭代计算陷入不必要的局部极小解,能够提高权重分配的合理性,进而得到了更为准确的聚类结果. 相似文献
8.
针对目前区间数据模糊聚类研究中区间距离定义存在的局限性,引入能够考虑区间数值分布特征的Wasserstein距离测度,提出基于Wasserstein距离测度的单指标和双指标自适应模糊聚类算法及迭代模型。通过仿真实验和CR指数,证实了该类模型的优势。该算法在海量、堆积如山的数据挖掘中有着重要的实践意义。 相似文献
9.
针对区间直觉模糊集(IVIFS)的聚类问题,提出了基于IVIFS的C均值聚类算法.算法首先应用IVIFS的欧氏距离,构造了聚类的目标函数;然后根据拉格朗日乘数法推导出聚类的迭代公式,得到IVIFS聚类算法;此外,还提出一种IVIFS聚类的有效性函数,并将此函数和聚类结合,给出可以确定最佳聚类类别数的聚类流程;最后通过实... 相似文献
10.
模糊c均值聚类算法中参数m的优选 总被引:6,自引:0,他引:6
本文利用模糊决策理论提出了一种模糊c均值(FCM)聚类算法中加权指数m的优选方法.文中定义了合适的模糊目标和模糊约束,通过模糊决策确定最佳的m值,以保证FCM算法获得好的聚类效果.实验结果显示了该方法的有效性,并得到实际应用中m的最佳取值范围为[1.5,2.5]. 相似文献
11.
基于Hadoop二阶段并行模糊c-Means数据聚类算法 总被引:1,自引:0,他引:1
为了解决MapReduce机制下算法通信时间占用比过高实际应用价值受限的问题,提出了基于Hadoop二阶段并行c-Means聚类算法;首先,采用成员管理协议方式实现成员管理与MapReduce降低操作的同步化方法,改进MapReduce机制下的MPI通讯管理方法;其次,实行典型个体组降低操作代替全局个体降低操作,并定义二阶段缓冲算法,通过第一阶段的缓冲进一步降低第二阶段MapReduce操作的数据量,尽可能降低大数据带来的对算法负面影响;通过仿真实验表明该算法在处理大数据上的性能表现较为优异;该算法在大规模数据集上的并行率和加速比都优于小型数据集上的表现,说明了该算法能够实时根据数据量的大小对自身进行调整。 相似文献
12.
13.
14.
数据挖掘过程中的模糊聚类方法 总被引:6,自引:0,他引:6
在研究数据挖掘过程中常见的数据聚类方法的基础上,在数据挖掘中引入了模糊聚类分析的方法,分析了该方法在数据挖掘过程中的特性,讨论了其在大型数据库中的应用方法。 相似文献
15.
针对传统面向分类属性数据的聚类算法大多是对单一指标优化而存在的局限性,将类内和类间信息同时引入到优化过程中,结合多目标优化算法与模糊中心点聚类,提出一种新颖的多目标模糊聚类算法.与传统的基于遗传算法的混合聚类方法不同的是,采用模糊隶属度对染色体进行编码,同时优化2个相对的聚类目标函数获得一组最优解集,并且采用了一种提前终止准则判断算法是否达到稳定状态并停止操作,以减少不必要的计算开销.为了进一步提高算法的效率,通过采样子集计算出相应的模糊中心点作为类的表达,然后以这些模糊中心点计算出全体样本的隶属度矩阵即可获得最终的聚类结果.对10种数据集的实验结果表明:所提方法在聚类精度和稳定性方面优于当前最新的多目标聚类算法,且计算效率也获得较大的提升. 相似文献
16.
图像分割是指将一幅图像分解为若干互不交迭的区域的集合,是图像处理和计算机视觉的基本问题之一。为了提高图像分割的效率,提出了一种基于2维直方图加权的塔形模糊c均值(FCM)聚类图像快速分割算法。该方法先通过构造合理的2维直方图对噪声进行抑制;然后通过塔形分解来缩减聚类样本集;最后利用加权FCM聚类算法进行分类。仿真结果表明,该方法的效率明显优于标准的FCM算法。此外,为确定分割的最优类别数c,还引入了一种基于该快速算法的聚类有效性评价函数——修正划分模糊度,实现了最佳图像分割类别数c的自动确定。基于人造图像和实际图像的测试实验结果表明该方法是有效的。 相似文献
17.
针对基于改进模糊聚类的数据融合算法存在融合不精确、融合可信度较低等不足,为了解决多个同质传感器在无先验知识的情况下对同一个目标的某一特征进行测量的数据融合问题,提出了一种自适应模糊[C]均值聚类的数据融合算法,主要是把自适应模糊[C]均值聚类应用到数据融合中。该算法首先在改进的模糊聚类中通过引入自适应系数以发现不同形状和大小的聚类子集,使得融合结果更精确;其次将卡尔曼滤波原理和基于多层感知机的神经网络预测法应用到误差协方差估计中,提高了融合可信度。实验结果表明,与7种经典数据融合算法进行对比,该算法在4个模拟数据集与真实数据集上融合结果较好,特别在判别函数与融合误差方面优势更为明显。 相似文献
18.
针对高维数据的聚类研究表明,样本在不同数据簇往往与某些特定的数据特征子集相对应.因此,子空间聚类技术越来越受到关注.然而,现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究中.为此,利用模糊可扩展聚类框架,与熵加权软子空间聚类算法相结合,提出了一种有效的熵加权流数据软子空间聚类算法——EWSSC(entropy-weighting streaming subspace clustering).该算法不仅保留了传统软子空间聚类算法的特性,而且利用了模糊可扩展聚类策略,将软子空间聚类算法应用于流数据的聚类分析中.实验结果表明,EWSSC 算法对于高维数据流可以得到与批处理软子空间聚类方法近似一致的实验结果. 相似文献