期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

戴涛李春平《计算机工程与应用》2004,40(30):186-187

概率聚类的算法已经广泛地应用于聚类分析领域,但是这些算法都没有回答如何选择一个最佳的聚类个数的问题。该文首先分析了通用的确定概率聚类个数的方法,然后针对蒙特卡罗交叉验证算法不能解决后验概率分散的问题,提出一种改进的蒙特卡罗交叉验证算法(iMCCV)。实验结果证明该算法可以有效地确定最佳K值。相似文献

2.

改进的二分K均值聚类算法

刘广聪黄婷婷陈海南《计算机应用与软件》2015,(2):261-263,277

K均值算法是一种常用的基于原型的聚类算法。但该算法要求用户随机选择初始质心,使得K均值算法受初始化影响较大。二分K均值算法虽然改善了这个问题,但仍然要求用户指定聚类个数,影响了聚类效果。用层次聚类对二分法进行改进,解决了二分K均值算法受用户指定的聚类个数的影响的问题。并结合Chameleon算法,合并划分过细簇,优化聚类结果。仿真实验证明改进的聚类算法的抱团性和分离性优于二分K均值聚类算法。相似文献

3.

一种改进的K—means聚类算法 总被引：1，自引：0，他引：1

周爱武崔丹丹肖云《微型机与应用》2011,30(21)

K—means算法是最常用的一种基于划分的聚类算法,但该算法需要事先指定K值、随机选择初始聚类中心等的缺陷,从而影响了K—means聚类结果的稳定性。针对K—means算法中的初始聚类中心是随机选择这一缺点进行改进,利用提出的新算法确定初始聚类中心,然后进行聚类,得出最终的聚类结果。实验证明,该改进算法比随机选择初始聚类中心的算法性能得到了提高,并且具有更高的准确性及稳定性。相似文献

4.

基于成对约束的SubKMeans聚类数确定算法

高波何振峰《计算机系统应用》2021,30(1):129-134

随着数据维度的增加,传统聚类算法会出现聚类性能差的现象.SubKMeans是一种功能强大的子空间聚类算法,旨在为K-Means类算法搜索出一个最佳子空间,降低高维度影响,但是该算法需要用户事先指定聚类数目K值,而在实际使用中有时无法给出准确的K值.针对这一问题,引入成对约束,将成对约束与轮廓系数进行结合,提出了一种基于成对约束的SubKMeans聚类数确定算法.改进后的轮廓系数能够更加准确的评价聚类性能,从而实现K值确定,实验结果证明该方法的有效性. 相似文献

5.

改进的全局K′-means算法及其在数据分类中的应用

李大字钱丽靳其兵《信息与控制》2011,40(1):0

为了解决初始聚类中心选择,簇个数的确定,以及孤立点等问题,本文提出了一种改进的全局K′-means算法。改进的算法不仅能够利用辅助聚类函数来计算初始点,而且能够利用目标函数在没有预定义聚类个数的前提下,找到实际的聚类中心个数,同时避免了孤立点问题。将改进的算法应用到实际数据集的分类中,并与改进的全局K-means算法以及K′-means算法进行了比较,实验结果证明所提出的算法能获得更好的聚类结果。相似文献

6.

基于三角不等式原理的TTSAS聚类加速算法

陈晓云王平何春霞冷明伟《计算机工程》2006,32(17):97-99,1

顺序聚类算法是一种非常直接和快速的算法，并且不需要提前确定聚类个数。但是当处理海量数据时，时间效率仍然有待提高。TTSAS算法是两个阈值的顺序聚类算法，在此基础上，该文应用三角不等式原理提出了TI_TTSAS算法，该算法避免了冗余的距离计算，实验结果证明，相对于TTSAS算法，TI_TTSAS在速度上有很大程度的提高，数据规模越大，改进效果越明显。并且聚类效果保持了TTSAS算法的准确性。相似文献

7.

一种适合于非线性高维数据的谱聚类算法

王鸿菲杜洪波林凯迪姚云飞朱立军《计算机应用与软件》2021,38(9):268-272,292

谱聚类能识别非线性数据,且优于传统聚类.谱聚类中度量相似性的高斯核函数尺度参数σ和聚类个数k对聚类效果影响较大,但需要人工判断.用向量之间夹角余弦代替σ并且通过特征值的跳跃性确定聚类个数,对于非线性高维数据,提出一种自适应谱聚类算法,将数据通过显式构造映射到随机特征空间,在随机特征空间中实现聚类.实验结果表明,在UCI数据上该算法与传统算法相比效果更好. 相似文献

8.

一种新的自适应中文网页聚类算法

谢志妮《现代计算机》2009,(12):51-57

提出一种新的自适应中文网页的聚类算法,该算法无需用户指定聚类的个数,而能够自动地确定聚类的个数,从而避免用户使用过程中聚类个数难以准确指定的问题。实验效果表明,利用本文的算法,用户可以更加快速地从搜索引擎返回的检索结果中取得自己所要寻找的信息。相似文献

9.

遗传优化的K均值聚类算法^①

胡彧毕晋芝《计算机系统应用》2010,19(6):52-55

在K均值聚类算法中,K值需事先确定且在整个聚类过程中不能改变其大小,而按照经验K值划分所得的最终聚类结果一般并非最佳结果。通过求解所构造适应度函数的值,在变异操作中实现最佳聚类数K值的自动寻优,同时借助遗传操作完成聚类中心点的优化选取并利用遗传算法的全局寻优能力克服了K均值聚类算法的局部性。通过对Iris等数据集的实验分析,证明该算法具有良好的全局收敛性,且通过K值的自动调整,有效提高了聚类结果的划分。相似文献

10.

基于熵聚类的RBF神经网络学习算法 总被引：2，自引：2，他引：0

王华丽周尚波《计算机仿真》2008,25(11)

RBF神经网络中心向量的确定是整个网络学习的关键,最常用确定中心向量的方法是K均值聚类算法,对聚类中心的初值选择非常敏感,选择的不好,容易减低网络的训练性能.为克服以上问题,提出了一种熵聚类的方法来自动确定RBF神经网络隐结点的中心个数及其初始值,实现K均值聚类算法的初始化,再用改进的K均值聚类算法调整RBF神经网络的中心和训练宽度.并将上述算法用于函数逼近问题.实验结果表明:改进的算法与常规的K均值聚类算法相比,提高了训练速度和逼近精度. 相似文献

11.

基于量子行为的微粒群优化算法的数据聚类

唐槐璐须文波龙海侠《计算机应用研究》2007,24(11):49-51

在PSO聚类算法的基础上,提出了基于量子行为的微粒群优化算法(QPSO)的数据聚类.QPSO算法不仅参数个数少、随机性强,并且能覆盖所有解空间,保证算法的全局收敛.PSO与QPSO算法的不同在于聚类中心的进化上,实验中用到四个数据集比较的结果,证明了QPSO优于PSO聚类方法.在聚类过程中使用了一种新的度量代替Euclidean标准,实验证明了新的度量方法比Euclidean标准更具有健壮性,聚类的结果更精确. 相似文献

12.

改进的聚类分析算法及其性能分析

郭书杰吴小欣黄杰《计算机时代》2010,(8):4-6

提出了一种改进的聚类分析算法,该算法采用类似中间聚类与最终聚类分布的思想,先对密集区域进行聚类,形成了K个聚类,然后再对相对分散的自由数据进行K—means聚类,使聚类分析在迭代过程中始终沿着最优的方向进行,减小了迭代次数,提高了收敛速度。该算法融合了网格聚类与K-均值聚类的优点,并且引入了一种新的划分网格的算法和新的计算密度阀值的函数。理论分析以及实验证明,改进算法的聚类过程达到了令人满意的效果。相似文献

13.

一种基于先验信息的混合数据聚类个数确定算法

庞天杰赵兴旺《计算机科学》2016,43(2):101-104

聚类个数的确定是聚类分析中一个富有挑战性的难题。现有的聚类个数确定方法主要采用随机选取初始聚类中心的策略,导致聚类过程中迭代次数的稳定性不强。基于此,在利用含有类标签的先验信息优化初始类中心的基础上,提出了一种基于先验信息的混合数据聚类个数确定算法。实验证明,该算法是有效的。相似文献

14.

结合最大最小距离和加权密度的K-means聚类算法

下载免费PDF全文

马克勤杨延娇秦红武耿琳王丕栋《计算机工程与应用》2020,56(16):50-54

随机选取初始聚类中心和根据经验设置[K]值对[K]-means聚类结果都有一定的影响,针对这一问题,提出了一种基于加权密度和最大最小距离的[K]-means聚类算法,称为[KWDM]算法。该算法利用加权密度法选取初始聚类中心点集,减少了离群点对聚类结果的影响,通过最大最小距离准则启发式地选择聚类中心,避免了聚类结果陷入局部最优,最后使用准则函数即簇内距离和簇间距离的比值来确定[K]值,防止了根据经验来设置[K]值。在人工数据集和UCI数据集上的实验结果表明,KWDM算法不仅提高了聚类的准确率,而且减少了算法的平均迭代次数,增强了算法的稳定性。相似文献

15.

基于SOM和BP网络的K均值聚类算法分析

赵文均《数字社区&智能家居》2020,(9):24-26

在数据挖掘中,K均值聚类算法作为最典型、最常见、实用度最广的一种聚类算法,具有简单易操作等优点。但K均值聚类算法也存在部分缺点,其在训练前需要提前设定聚类中心个数,在训练过程中容易陷入局部最优,面对多维数据样本其效果不佳,得到的聚类结果受初始聚类中心个数的设定影响较大。对k均值聚类算法的优化方案较多,本文主要针对前人提出的基于BP神经网络的K均值聚类算法和基于SOM网络改进的K均值聚类算法效果进行分析,为后续的进一步改进提供基础。相似文献

16.

基于遗传算法学习聚类算法的中心个数 总被引：2，自引：0，他引：2

湛燕杨芳王熙照《计算机工程与应用》2003,39(16):86-87,99

无导师聚类算法的目标是将一个数据集划分为若干个类,使得类内相似性尽可能大且类间相似性尽可能小。聚类过程中对数据集合分割成多少个类是一个很难确定的问题,目前还没有较好的解决方法。文章使用遗传算法对无导师聚类K-均值(K-means)算法中中心个数K值进行学习,实现了使用遗传算法进行聚类中心个数的确定,旨在提供一种选择中心参数个数的方法。通过对UCI机器学习数据库中的7个数据库进行实验,证实此方法是比较有效的。相似文献

17.

改进的全局K'-means算法及其在数据分类中的应用

李大字钱丽靳其兵谭天伟《信息与控制》2011,40(1)

为了解决初始聚类中心的选择、簇个数的确定以及孤立点的避免等问题,提出了一种改进的全局K'-means算法.改进的算法不仅能够利用辅助聚类函数来计算初始点,而且能够利用目标函数在没有预定义聚类个数的前提下,找到实际的聚类中心个数,同时避免r孤立点问题.将改进的算法应用到实际数据集的分类中,并与改进的全局K-means算法以及K'-means算法进行了比较,实验结果证明所提出的算法能获得更好的聚类结果. 相似文献

18.

K-means算法的初始值选取问题的研究

姚蒙何鹏程《福建电脑》2023,(7):57-61

随着数据爆发式的增长,数据挖掘算法的使用更加频繁,因此选取合适的数据挖掘算法进行数据分析是非常有必要的。本文对确定K-means算法初始值的问题,提出了一种数据预处理的优化方案。通过对目标数据集进行Canopy算法处理,并对Canopy算法执行后的分组进行降噪、合并,以最终的分组个数作为K-means算法的分组K值,并以各分组的重心作为初始聚类重心,从而确定K-means算法的初始值。对比实验的结果显示,优化后的K-means算法具有更好的聚类效果。相似文献

19.

自适应K值的粒子群聚类算法

白树仁陈龙《计算机工程与应用》2017,53(16):116-120

传统K-means算法除了对初始聚类中心的选择非常敏感,易收敛到局部最优解外,还存在着K值难以确定的问题,不合适的K值往往会得到较差的聚类结果。而K值问题也是聚类分析中的一个重要的研究方向,在粒子群聚类算法的基础上,结合K-means算法,提出了自适应K值的粒子群聚类算法。当算法收敛时,可通过比较不同K值时全局最优适应度值之间的关系来决定K值的增大与减小。实验表明改进的算法可以有效指导K值的选取,并且具有较好的聚类效果。相似文献

20.

不确定PAHT聚类算法在滑坡危险性预测上的应用

胡健朱玲毛伊敏《计算机应用研究》2019,36(5)

针对滑坡预测聚类研究中由于难以确定传统聚类算法需要预先设置的簇个数和无法精准衡量不确定因素降雨量导致预测效果欠佳的问题,提出一种新的聚类算法—不确定PAHT（partition algorithm on the hierarchical thinking）算法,该算法引入一种不确定数据模型——M-D距离,其有效刻画了不确定的雨量数据;并结合层次聚类思想,通过找出最佳阙值p*自动确定k值。以延安宝塔区为实例进行对比实验,实验结果验证了不确定M-D距离和PAHT算法的有效性及不确定PAHT算法在滑坡危险性预测上的可行性。相似文献