首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
针对初始聚类中心对传统K-means算法的聚类结果有较大影响的问题,提出一种依据样本点类内距离动态调整中心点类间距离的初始聚类中心选取方法,由此得到的初始聚类中心点尽可能分散且具代表性,能有效避免K-means算法陷入局部最优。通过UCI数据集上的数据对改进算法进行实验,结果表明改进的算法提高了聚类的准确性。  相似文献   

2.
针对K-Means算法所存在的问题,提出了一种改进的K-Means算法,该方法通过选取相互距离最远的数据点作为初始聚类中心,能够很好地排除随机选取初始聚类中心点的影响.通过实验验证,相对于传统K-Means算法,改进K-Means算法能够获得更好的聚类效果.  相似文献   

3.
针对K-means聚类算法存在的初始中心点选择及异常点、离群点极易影响聚类结果等待改进问题,提出了一个基于Tukey规则与优化初始中心点选择的K-means改进算法。该算法利用Tukey规则构造核心与非核心子集,将聚类过程划分成2个阶段。同时,在核心子集上执行中心点逐个递增优化选择策略,选出初始中心点。在来自UCI的20个数据集上聚类结果表明,本文提出的算法优于K-means++聚类算法,有效地提升了聚类性能。  相似文献   

4.
针对初始聚类中心不合理的选择会导致K-means算法的聚类结果局部最优,且降低聚类算法收敛速度的问题,提出一种基于近邻传播算法和最大最小距离算法联合计算初始聚类中心的算法(APMMD).该算法通过近邻传播算法从整个样本集中获得Kap(Kap>k)个具有代表性的候选中心点,再利用最大最小距离算法从Kap个候选中心点中选择k个初始聚类中心.在多个UCI数据集上实验,结果表明APMMD算法获得初始聚类中心应用于K-means聚类,迭代次数明显降低,聚类结果稳定且具有较高准确率.  相似文献   

5.
模糊C均值(FCM)聚类算法对初始中心点敏感,不考虑类别间中心点的相互影响,且仅能处理低维数据。为此,设计一种改进的初始中心点选择方法,并基于条件模糊聚类思想,将传统FCM算法中的欧氏距离替换为余弦距离后提出wHFCLM算法。将该算法与扩展增量聚类算法spFCM、oFCM和rseFCM相结合,得到对应的扩展增量模糊聚类算法spHF(c+l)M、oHF(c+l)M以及rseHF(c+l)M。实验结果表明,与spFCM算法、oFCM算法和rseFCM算法相比,扩展增量模糊聚类算法对初始中心点的选择敏感性较低,能较好地处理大规模稀疏高维数据集,且在合适的分块大小下具有更优的聚类性能。  相似文献   

6.
针对模糊文本聚类算法(FCM)对输入顺序以及初始点敏感的问题,提出了一种使用蚁群优化的模糊聚类算法(FACA)。该算法采用蚁群聚类算法(ACA)找到聚类的初始中心点,以解决模糊聚类的输入顺序以及初始点敏感等问题。模糊文本聚类算法的线性复杂度使其更便于在计算机实现。与经典的基本模糊聚类以及蚁群聚类在真实数据集上仿真相比较,结果表明经蚁群优化过的模糊聚类算法(FACA)效果更有效,更适合应用于大型的数据集。  相似文献   

7.
针对传统模糊C-均值(Fuzzy C-Means, FCM)聚类算法隐含假设各个样本和各维属性对聚类结果作用相同,导致算法聚类性能降低,以及对初始中心点敏感且易陷入局部最优的问题,提出一种基于改进蝙蝠算法优化的FCM聚类算法。该算法首先采用混沌映射和速度权重来改进蝙蝠算法,然后利用改进蝙蝠算法确定FCM算法的初始聚类中心,最后根据各个样本和各维属性对聚类结果作用不同,采用样本和属性加权法对FCM算法的目标函数重新设计。实验结果表明,改进算法表现出较好的聚类效果。  相似文献   

8.
基于密度的K-means聚类中心选取的优化算法   总被引:2,自引:0,他引:2  
针对传统的K-means算法对于初始聚类中心点和聚类数的敏感问题,提出了一种优化初始聚类中心选取的算法。该算法针对数据对象的分布密度以及计算最近两点的垂直中点方法来确定k个初始聚类中心,再结合均衡化函数对聚类个数进行优化,以获得最优聚类。采用标准的UCI数据集进行实验对比,发现改进后的算法相比传统的算法有较高的准确率和稳定性。  相似文献   

9.
为探寻区域性小麦品质聚类的适宜算法,针对经典K-Means(KM)算法对初始聚类中心的敏感问题,以我国主要冬麦区为研究实例,探讨了两种初始中心点改进算法对大规模小麦品质数据集的适应性,综合距离与密度两因素,提出了一种基于密度参数和邻域半径的优化初始中心点小麦品质聚类算法。相对KM算法及文献改进算法,所提算法可较为准确地提取数据集高密度区域的初始中心点,聚类过程及性能对静态簇与非静态簇两种不同迭代方案相对不敏感。实验结果验证了算法的有效性和可行性,在收敛性能及稳定性方面具有一定的优势。  相似文献   

10.
粒子群优化(PSO)的K-Medoids进化聚类算法中初始种群是随机产生的,导致选择的初始中心点有可能位于同一类簇中.为提高聚类准确性,提出一种采用递减概率化初始点选择的PSO与K-Medoids结合新算法.根据样本的分布密度设置对应的选择概率,并由轮盘赌策略依次选择中心点,使获得的中心点位于密度较高区域且在不同的簇中,同时又实现了初始种群的多样性.在人工和UCI真实数据集上的实验结果表明,改进后的算法有更快的收敛速度,提高了聚类准确率和稳定性.  相似文献   

11.
传统谱聚类对初值选取十分敏感,严重影响了聚类效果。为了解决初值敏感问题,提出了基于CMT-FCM(借鉴历史知识的类中心距离极大化聚类算法)的自适应谱聚类算法。该算法以样本空间的标准差作为尺度参数,实现了尺度参数的自适应选取,提高了算法效率;而通过借鉴历史知识,引入类中心距离极大化项,避免了干扰点对类中心的干扰,提高了算法鲁棒性。通过在模拟数据集以及真实数据集上测验,取得了比传统谱聚类更稳定的聚类效果,验证了算法的有效性。  相似文献   

12.
邓小燕 《控制工程》2020,(1):182-187
在处理属性值为犹豫模糊信息的聚类分析问题过程中,一般性的犹豫模糊聚类算法在样本空间层面处理过程中存在消耗时间长、距离结果不精确等不足。为了解决这一问题,建立了一种新颖的犹豫模糊聚类算法,即犹豫模糊核C-均值聚类算法,该算法运用核函数将样本空间中的数据映射到一个高维特征空间。结果显示,通过提出的犹豫模糊核C-均值聚类算法能够扩大不同样本之间的差异,并且使得聚类结果更加准确。最后,通过数据库系统选择的仿真实验,验证了所提出的犹豫模糊核C-均值聚类算法的可行性和有效性。  相似文献   

13.
利用粒子群优化(PSO)算法全局寻优的特点,很大程度上避免了模糊C-均值聚类(FCM)算法对初值敏感、易陷入局部收敛的缺陷.利用收敛速度快的K均值聚类法得到的聚类中心作为PSO算法初始聚类中心的参考,提出一种新的模糊C-均值聚类算法Improved PSO FCM.实验结果表明,论文算法提高了FCM的搜索能力,聚类更为准确,效率更高.  相似文献   

14.
边缘检测是图像分割和模式识别的必要工作。首先分析了传统的导数算子Sobel和Canny的检测原理及其优缺点。然后针对图像边缘检测的特点,从模糊聚类角度出发,提出一种改进的蚁群算法。根据图像灰度和梯度特征设置初始聚类中心,改进启发式函数,将蚁群算法得到的聚类中心作为模糊C均值聚类的初始中心,再进行FCM聚类,实现基于目标函数的模糊聚类。最后对文中提到的各种算法的实验结果进行比较与分析,结果表明文中改进算法是有效的。  相似文献   

15.
提出一种密度敏感模糊核最大熵聚类算法.该算法首先通过核函数将原始非线性非高斯的数据集转化为核空间数据集,然后利用核函数的相似性抵消不属于该聚类的样本数据在聚类过程中对聚类中心求解的干扰,消除正则化系数对聚类结果的影响,进而抑制传统最大熵聚类算法的趋同性.最后通过引入相对密度项,解决因样本数据在特征空间的分布差异而导致的聚类中心求解偏差问题,从而提高聚类结果的准确性.实验部分,本文讨论了算法参数间的关系以及对聚类结果的影响.通过与传统模糊C均值聚类算法、核模糊C均值聚类算法、最大熵聚类算法、最大熵规范化权重核模糊C均值聚类算法以及其他两种改进最大熵聚类算法的聚类结果进行对比分析,结果表明本文提出的密度敏感模糊核最大熵聚类算法的聚类性能明显优于其他算法.  相似文献   

16.
改进的模糊C均值聚类算法   总被引:4,自引:0,他引:4       下载免费PDF全文
把自适应的策略与传统的模糊C均值聚类算法结合起来,形成新的模糊聚类算法。在不影响收敛速度的情况下,它能够很好解决局部最优以及对初始值敏感的问题。以UCI机器学习数据库中的两组数据集为研究对象,实验结果表明,它的精确度与自适应免疫聚类算法相当,能够得到准确的簇的数目,并且它的收敛速度更快,这对于如今网络数据的高速变化来说,该方法显得更为重要。  相似文献   

17.
一种改进的基于遗传算法的模糊C-均值算法   总被引:4,自引:0,他引:4  
侯惠芳  刘素华 《计算机工程》2005,31(17):152-154
把遗传算法搜索的随机性和并行性引入到模糊聚类中,克服了模糊C-均值聚类的局部性和对初始聚类中心的敏感性;该改进算法中采用了适合于模糊聚类的树型编码方案,且在遗传算法中采用了适合于模糊聚类的树型编码方案。同时详细设计了该方法,将该算法引入仓储物害虫的模式识别分类系统中,实验结果表明了该算法的可行性和有效性。  相似文献   

18.
一般空间模糊聚类算法没有区分各属性之间的不平衡性和讨论分类数何时为最佳,针对这一问题,提出了一种加权空间模糊动态聚类算法。该算法首先利用层次分析法得到各属性的权值;然后将权值与空间模糊动态聚类法相结合;最后利用概率统计中的F-分布来确定最佳分类,以提高空间模糊聚类算法的智能性。将文中算法与基于模糊等价关系的传递闭包方法进行比较,试验表明,该算法聚类准确率要明显高于未加权的模糊聚类算法。  相似文献   

19.
Fuzzy c-means clustering with spatial constraints is considered as suitable algorithm for data clustering or data analyzing. But FCM has still lacks enough robustness to employ with noise data, because of its Euclidean distance measure objective function for finding the relationship between the objects. It can only be effective in clustering ‘spherical’ clusters, and it may not give reasonable clustering results for “non-compactly filled” spherical data such as “annular-shaped” data. This paper realized the drawbacks of the general fuzzy c-mean algorithm and it tries to introduce an extended Gaussian version of fuzzy C-means by replacing the Euclidean distance in the original object function of FCM. Firstly, this paper proposes initial kernel version of fuzzy c-means to aim at simplifying its computation and then extended it to extended Gaussian kernel version of fuzzy c-means. It derives an effective method to construct the membership matrix for objects, and it derives a robust method for updating centers from extended Gaussian version of fuzzy C-means. Furthermore, this paper proposes a new prototypes learning method and it obtains initial cluster centers using new mathematical initialization centers for the new effective objective function of fuzzy c-means, so that this paper tries to minimize the iteration of algorithms to obtain more accurate result. Initial experiment will be done with an artificially generated data to show how effectively the new proposed Gaussian version of fuzzy C-means works in obtaining clusters, and then the proposed methods can be implemented to cluster the Wisconsin breast cancer database into two clusters for the classes benign and malignant. To show the effective performance of proposed fuzzy c-means with new initialization of centers of clusters, this work compares the results with results of recent fuzzy c-means algorithm; in addition, it uses Silhouette method to validate the obtained clusters from breast cancer datasets.  相似文献   

20.
传统的模糊C-均值聚类算法存在对初始聚类中心选择与噪声数据敏感,容易使目标函数陷入局部最优的问题以及标准人工蜂群算法局部搜索能力及开发能力不强的缺点,针对这个问题,引进差分进化的思想改进人工蜂群算法并对跟随蜂的搜索行为进行更准确的描述,结合模糊C-均值聚类算法具有收敛速度快、易于实现且局部搜索能力较强的优点,提出一种基于模糊C-均值的改进人工蜂群聚类算法以提高聚类的性能。实验结果表明:该算法相对于传统FCM聚类算法,准确率和抗噪性有所提高,聚类的效果更好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号