共查询到20条相似文献,搜索用时 15 毫秒
1.
从传统K-means算法对初始中心的敏感性分析出发,提出了一种优化初始聚类中心的算法.该算法结合一种改进的遗传算法和网络中心数学模型对初始中心进行优化,有效地解决了算法对初始聚类中心的敏感性问题,取得了较好的实验结果. 相似文献
2.
3.
针对传统的K-means算法对初始聚类中心的敏感很大,极易陷入局部最优值,基于遗传算法的K-means聚类算法由于个体的多样性不足而常出现早熟等现象,采用遗传模拟退火算法优化初始聚类中心点后进行K-means聚类,并提出了一种新的用于评价聚类结果的适应度函数,该函数更为准确地反映类内距离和类间距离.实验结果表明,该方法能获得更好的聚类结果. 相似文献
4.
5.
6.
K-means聚类算法在随机选择的初始聚类中心的基础上进行聚类,其聚类效果会因为初始聚类中心的不确定性而不稳定。为了优化其聚类效果,提出了基于近邻传播算法(AP算法)的K-means聚类优化算法(APK-means)。该算法首先通过近邻传播算法生成若干个初始聚类,然后依序选择k个聚类规模最大的聚类中心作为K-means聚类算法的初始聚类中心,接着运行K-means聚类。算法有效性分析和实验结果验证了该算法有效优化了K-mean算法的聚类稳定性和有效性。 相似文献
7.
一种改进的特征加权K-means聚类算法 总被引:4,自引:0,他引:4
提出了一种改进的特征加权K-means聚类算法.该算法首先基于数据样本分布选取初始聚类中心,然后设计特征加权的K-means聚类算法.实验结果证明,该算法能产生质量较高的聚类结果,并且能处理数值、符号两类数据. 相似文献
8.
9.
10.
基于划分的K-均值初始聚类中心优化算法 总被引:6,自引:2,他引:6
提出了一种新的初始化K-means的聚类算法,该算法通过区域划分方法估算出K个中心点作为初始聚类中心,从初始聚类中心出发,应用K-means聚类算法,得到聚类结果,实验表明,该算法能产生高质量的聚类结果、较少的迭代次数,优于K-means算法中传统的聚类中心初始化算法. 相似文献
11.
针对K-means算法对于初始聚类中心选择敏感问题,提出了一种改进的K-means算法,该算法优化了聚类中心选择问题,能够获得全局最优的聚类划分,同时减少了算法的时间复杂度。实验结果表明,采用本文的算法进行网络入侵检测,相对于经典的聚类算法,能获得理想的网络入侵检测率和网络误报率。 相似文献
12.
13.
14.
15.
16.
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。 相似文献
17.
传统K-means聚类算法容易受到初始聚类中心影响,从而导致聚类准确度较差的问题,本文利用剑鱼优化算法全局搜索能力强、收敛速度快的优势,提出一种基于改进剑鱼算法的K-means聚类算法.为增强剑鱼优化算法全局搜索能力,采用Tent混沌序列初始化种群,利用Tent混沌序列遍历性、随机性和规律性提高初始解的质量;为了提升算... 相似文献
18.
本文对传统蚂蚁聚类算法易出现早熟和收敛速度慢的问题,提出了基于改进K-means蚂蚁聚类算法,并将优化后的聚类算法与优化填充策略结合,对半失能老人远程健康监测缺失数据进行填充。仿真结果说明:改进K-means蚂蚁聚类算法的分类精度有所提高,基于改进K-means蚂蚁聚类的缺失数据填充算法的填充效果有所改善,可以有效填充半失能老人远程健康监测的缺失数据。 相似文献
19.
针对层次聚类法和 K-means 聚类法的缺陷和不足,提出将二者相结合的改进算法,既解决了层次聚类法伸缩性差的问题,又解决了 K-means聚类法对初始聚类中心敏感的问题。通过对改进算法的计算复杂度分析并利用 UCI 数据库的测试数据对改进算法进行测试。结果表明,混合聚类算法使样本聚类的准确率提高到94%,并有更高的执行效率和更好地实用性。此外,将此算法应用到汽车销售公司的客户细分管理中,得出了差别化明显的客户细分类别,表明此改进算法具有更强的客户细分能力以及客户行为特征的解释能力。 相似文献
20.
传统的K-means算法由于随机选择初始聚类中心,使得聚类结果不精确.随着网络数据量的激增,传统的串行算法运算时间明显太长,有研究者利用Hadoop并行框架进行K-means并行化研究,虽然提高了算法的运行时间,但K-means算法在聚类判定时需要反复迭代,反复进行磁盘的读写操作,很大一部分时间花费在磁盘操作上,并行算法的效率大打折扣.为此,本文提出基于Spark框架的改进并行K-means算法,通过对RDD的操作有效解决了频繁的磁盘读写.在标准数据集下,进行对比实验,通过聚类效果和算法并行的加速比,验证了改进算法的有效性. 相似文献