共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
针对区间型数据的模糊c均值聚类(IFCM)算法在实际应用中的不足,将可能性理论引入区间型数据的聚类问题,通过放松样本隶属度的约束条件和修正IFCM算法的目标函数,提出一种区间型数据的可能性聚类算法。通过仿真模拟实验和平均CR指标分析,结果表明:在包含噪声和孤立点等代表性比较差的样本数据的聚类问题中,该算法明显优于IFCM算法,能有效地降低噪声对聚类效果的影响。 相似文献
3.
针对目前区间数据模糊聚类研究中区间距离定义存在的局限性,引入能够考虑区间数值分布特征的Wasserstein距离测度,提出基于Wasserstein距离测度的单指标和双指标自适应模糊聚类算法及迭代模型。通过仿真实验和CR指数,证实了该类模型的优势。该算法在海量、堆积如山的数据挖掘中有着重要的实践意义。 相似文献
4.
5.
6.
7.
针对区间型数据的聚类问题,提出一种自适应模糊c均值聚类算法。该算法一方面基于区间数的中点和半宽度,通过引入区间宽度的影响因子以控制区间大小对聚类结果的影响;另一方面通过引入一个自适应系数,以减少区间型数据的数据结构对聚类效果的影响。通过仿真数据和Fish真实数据验证了该算法的有效性,并对聚类结果进行比较和分析。 相似文献
8.
应用K-均值聚类的方法区分源于不同目标的观测数据,通过类间数据融合,实现对多目标的实时跟踪。研究了观测数据K-均值聚类的基本思想、聚类处理过程及算法实现,讨论了对机动目标跟踪的Kalman滤波方程及空管系统中易于计算的各参数矩阵理论依据及相应的初值。发现通过K-均值聚类能很好区分不同目标,聚类后再进行跟踪融合更加准确。仿真结果表明,经K-均值聚类处理后的滤波跟踪航迹效果较好。 相似文献
9.
岳明道 《计算机工程与应用》2011,47(13):157-160
在传统模糊C-均值聚类算法的基础上,提出了一种新型区间值数据模糊聚类算法。运用区间分割策略改进了区间距离的计算公式,成功解决了区间距离计算方法存在的缺陷。提出了区间值数据模糊聚类的数学模型,并拓广模糊C-均值算法对区间值数据进行聚类。仿真验证了所提出算法的有效性。 相似文献
10.
基于核的K-均值聚类 总被引:17,自引:0,他引:17
将核学习方法的思想应用于K-均值聚类中,提出了一种核K-均值聚类算法,算法的主要思想是:首先将原空间中待聚类的样本经过一个非线性映射,映射到一个高维的核空间中,突出各类样本之间的特征差异,然后在这个核空间中进行K-均值聚类。同时还将一种新的核函数应用于核K-均值聚类中以提高算法的速度。为了验证算法的有效性,分别利用人工和实际数据进行K-均值聚类和核K-均值聚类,实验结果显示对于一些特殊的类分布数据,核K-均值聚类比K-均值聚类具有更好的聚类效果。 相似文献
11.
基于Hadoop的仿射传播大数据聚类分析方法 总被引:1,自引:0,他引:1
唐东明 《计算机工程与应用》2015,51(4):29-34
仿射传播聚类算法(AP)是一个新的聚类分析方法,已经被广泛应用于各种领域。APC算法不能用于大型数据的分析。为了克服这个限制,在Hadoop分布式框架的基础上提出一种改进的放射传播聚类分析方法(基于Hadoop的仿射传播大数据聚类分析方法,简称APCH)。通过在Hadoop环境下重新设计算法流程,APCH算法成为了一个并行化的大数据聚类分析方法。此外APCH算法能够高效操作大数据,并能够直接决定聚类的个数。为了验证方法的性能,在多个数据集上进行了实验。实验结果表明APCH对大数据处理有很好的适应性和延展性。APCH采用开源的方式提供可执行软件程序和源代码,用户可以下载后部署在自己的分布式集群中或者是部署在亚马逊EC2等云计算环境中。所有编译后的执行程序,源代码,用户手册,部分测试数据集均可以从https://github.com/HelloWorldCN/MapReduceAPC上下载。 相似文献
12.
Francisco de A.T. De Carvalho Author Vitae Yves Lechevallier Author Vitae 《Pattern recognition》2009,42(7):1223-610
This paper introduces dynamic clustering methods for partitioning symbolic interval data. These methods furnish a partition and a prototype for each cluster by optimizing an adequacy criterion that measures the fitting between clusters and their representatives. To compare symbolic interval data, these methods use single adaptive (city-block and Hausdorff) distances that change at each iteration, but are the same for all clusters. Moreover, various tools for the partition and cluster interpretation of symbolic interval data furnished by these algorithms are also presented. Experiments with real and synthetic symbolic interval data sets demonstrate the usefulness of these adaptive clustering methods and the merit of the partition and cluster interpretation tools. 相似文献
13.
14.
通过学习数据集的低维流形结构,给出一种流形距离测度;结合成对约束信息,调整数据的相似度矩阵,将其作为近邻传播算法的输入,提出了基于流形距离的半监督近邻传播聚类算法(SAP-MD)。通过在UCI标准数据集上的仿真实验表明,SAP-MD算法相比于仅利用成对约束信息的聚类算法,在聚类性能上有很大提高。 相似文献
15.
为了提高进化数据流的聚类质量,提出基于半监督近邻传播的数据流聚类算法(SAPStream),该算法借鉴半监督聚类的思想对初始数据流构造相似度矩阵进行近邻传播聚类,建立在线聚类模型,随着数据流的进化,应用衰减窗口技术对聚类模型适时做出调整,对产生的类代表点和新到来的数据点再次聚类得到数据流的聚类结果。对数据流进行动态聚类的实验结果表明该算法是高质有效的。 相似文献
16.
17.
18.
在不确定性数据聚类算法的研究中,普遍需要假设不确定性数据服从某种分布,继而获得表示不确定性数据的概率密度函数或概率分布函数,然而这种假设很难保证与实际应用系统中的不确定性数据分布一致。现有的基于密度的算法对初始参数敏感,在对密度不均匀的不确定性数据聚类时,无法发现任意密度的类簇。鉴于这些不足,提出基于区间数的不确定性数据对象排序识别聚类结构算法(UD-OPTICS)。该算法利用区间数理论,结合不确定性数据的相关统计信息来更加合理地表示不确定性数据,提出了低计算复杂度的区间核心距离与区间可达距离的概念与计算方法,将其用于度量不确定性数据间的相似度,拓展类簇与对象排序识别聚类结构。该算法可很好地发现任意密度的类簇。实验结果表明,UD-OPTICS算法具有较高的聚类精度和较低的复杂度。 相似文献