首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
基于遗传算法的聚类分析   总被引:39,自引:2,他引:39  
给出了一种基于遗传算法的聚类分析方法。采用二进制编码方式对聚类的中心进行编码,并用特征向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过选择、交叉和变异操作对聚类中心的编码进行优化,得到便聚类划分效果最好的聚类中心。实验结果显示,该方法的聚类划分效果明显优于传统的K-均值方法。  相似文献   

2.
提出一种基于差分算法的聚类分析方法,采用结构体数组对聚类的中心进行编码,并用样本向量与相应聚类中心的欧氏距离的和来判断聚类划分的质量,通过变异、交叉和选择操作对聚类中心的编码进行优化,以获得最好的聚类中心.通过差分算法的全局搜索能力,来获取全局最优结果.实验结果显示,该方法的聚类划分效果明显优于传统的K-均值方法,也一般优于基于遗传算法的聚类算法和基于微粒群的聚类算法.  相似文献   

3.
针对传统谱聚类算法在路网划分时承载路网信息较少和聚类中心优化问题,提出一种基于改进谱聚类算法的城市路网划分算法.通过转移概率模拟交通路网动态运行特征,利用马尔可夫链对谱聚类相似图进行重构,增强相似图的健壮性,与遗传算法结合,通过遗传算法优化初始聚类中心,提高谱聚类全局寻优能力.实验结果表明,改进后的算法比基准算法具有较好的聚类效果,能够有效划分城市路网.  相似文献   

4.
将模拟退火遗传算法用于聚类分析,通过对聚类中心进行编码,定义适应度函数,选择、交叉、变异操作以及模拟退火算法的运用,给出了一种新的基于模拟退火遗传算法的聚类算法,实验结果显示该方法优于基本的遗传算法.  相似文献   

5.
基于可变染色体长度的遗传K均值聚类算法   总被引:2,自引:2,他引:0  
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进.该算法可以在事先不确定K值的情况下,通过多次的选择、交叉.变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集.通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法.  相似文献   

6.
基于并行遗传算法的K-means聚类研究   总被引:1,自引:0,他引:1  
针对传统K-means聚类算法对初始聚类中心的选择敏感,以及聚类数K难以确定的问题,提出一种基于并行遗传算法的K-means聚类方法.该方法采用一种新型的可变长染色体编码方案,随机选择样本点作为初始聚类中心形成染色体,然后结合K-means算法的高效性和并行遗传算法的全局优化能力,通过种群内的遗传、变异和种群间的并行进化、联姻,有效地避免了局部最优解的出现,同时得到了优化的聚类数目和聚类结果.实验表明该方法是一种精确高效的聚类方法.  相似文献   

7.
将模拟退火遗传算法用于聚类分析,通过对聚类中心进行编码,定义适应度函数,选择、交叉、变异操作以及模拟退火算法的运用,给出了一种新的基于模拟退火遗传算法的聚类算法,实验结果显示该方法优于基本的遗传算法。  相似文献   

8.
针对FCM聚类算法时初始聚类中心的选择敏感,以及聚类数C难以确定的问题,提出一种基于遗传算法的自适应文本模糊聚类方法.该方法首先将文档集合表示成向量空间模型,并采用一种新型的可变长染色体编码方案,随机选择文本向量作为初始聚类中心形成染色体,然后结合FCM算法的高效性和遗传算法的全局优化能力,通过遗传进化,有效地避免了局部最优解的出现,同时得到了优化的聚类数目和聚类结果.实验表明该算法是一种精确高效的文本聚类方法.  相似文献   

9.
K-means算法是聚类分析中的一种经典算法,但是K-means算法是一种局部搜索技术,受初始聚类中心的影响可能会过早收敛于最优解.而遗传算法具有良好的全局优化的能力,将遗传算法与K-means算法结合起来,能很好解决这一问题.在结合的过程中,又在最传统的遗传算法中改进染色体编码与适应度函数,从而优化k个中心点的选取,...  相似文献   

10.
传统K-均值算法对初始聚类中心敏感大,易陷入局部最优值.将遗传算法与K均值算法结合起来进行探讨并提出一种改进的基于K-均值聚类算法的遗传算法,改进后的算法是基于可变长度的聚类中心的实际数目来实现的.同时分别设计出新的交叉算子和变异算子,并且使用的聚类有效性指标DB-Index作为目标函数,该算法很好地解决了聚类中心优化问题,与之前的两种算法相比,改进后的算法改善了聚类的质量,提高了全局的收敛速度.  相似文献   

11.
田雪  朱晓杰  申培松  陈驰  邹洪 《软件学报》2016,27(6):1566-1576
随着云计算的广泛应用,数据中心的数据量急速增加,同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器,面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对此问题,本文提出在大数据下的基于相似查询树的密文检索方法(MRSE-SS),该方法通过设置聚类中心和成员之间的最大距离对文档向量进行聚类,并把中心向量看成n维超球体的球心,最大距离作为半径,再逐步将小聚类聚合成大聚类.使用该方法构建的密文文档集合,在查询阶段仅需检索查询向量相邻的聚类即可获得理想的查询结果集合,从而提高了密文检索的效率.本文还以《软件学报》期刊最近10年的论文作为样本进行了实验,数据集中选取2900篇文章和4800个关键词,实验结果显示,当文档集个数呈指数增长的时候,检索时间仅呈线性增长,并且检索结果的关联性比传统检索方法更强.  相似文献   

12.
针对密度峰值聚类算法CFSFDP(Clustering by fast search and find of density peaks)计算密度时人为判断截断距离和人工截取簇类中心的缺陷,提出了一种基于非参数核密度估计的密度峰值的聚类算法。首先,应用非参数核密度估计方法计算数据点的局部密度;其次,根据排序图采用簇中心点自动选择策略确定潜在簇类中心点,将其余数据点归并到相应的簇类中心;最后,依据簇类间的合并准则,对邻近相似子簇进行合并,并根据边界密度识别噪声点,得到聚类结果。在人工测试数据集和UCI真实数据集上的实验表明,新算法较之原CFSFDP算法,不仅有效避免了人为判断截断距离和截取簇类中心的主观因素,而且可以取得更高的准确度。  相似文献   

13.
基于遗传算法和遗传模糊聚类的混合聚类算法   总被引:3,自引:1,他引:2  
张强  李淼 《计算机工程与应用》2007,43(3):164-165,197
为了动态确定聚类数目C和该数目下的最优分类,构造出遗传算法和模糊遗传C均值聚类的混合聚类算法(HGA-FGCM),该方法构造了一个既考虑类与类之间的分散程度,又考虑同一类紧凑程度的目标评价函数;运用遗传算法的全局寻优能力,求得最佳聚类数下的最优聚类。  相似文献   

14.
一种基于广度优先搜索的K-means初始化算法   总被引:1,自引:0,他引:1       下载免费PDF全文
K-means算法是在现实应用中非常广泛的聚类算法,K-means算法对初始中心的选择非常敏感,对已存在的有代表性的初始算法进行了研究,提出了一种基于广度优先搜索的K-means初始化算法。该算法综合考虑了密度与距离因素,选择初始点。分析表明该算法选择的初始点非常接近期望的中心点。  相似文献   

15.
聚类分析的两个基本任务是分析数据集中簇的数量以及这些簇的位置。大多数的聚类方法通常只关注后一个问题。为了在聚类数不确定的情况下实现聚类分析,本文提出了一种新的结合人工免疫网络和Tabu搜索的动态聚类算法—DCBIT。新算法主要包含两个阶段:先使用人工免疫网络算法获得一个候选聚类中心集,然后使用Tabu搜索在候选聚类中心集上实现动态聚类。仿真实验结果表明与现有方法相比,新方法具有更好的收敛概率和收敛速度。  相似文献   

16.
密度峰值快速搜索聚类CFSFDP算法选择聚类中心时需要通过人工在决策图中选择,且最后进行簇核心与簇光晕划分时会将簇的一些边缘部分划入簇光晕中,导致划分结果不够合理。针对以上问题,提出一种聚类中心自动选择及簇核心与簇光晕分割优化的聚类算法。利用异常检测的思想,寻找簇中心权值的异常点,将异常点作为各簇的聚类中心;引入簇内局部密度,实现对簇核心与簇光晕更合理的分割。通过实验对比,本文提出的算法自动化效果优于CFSFDP算法且得到的聚类结果更为精确。  相似文献   

17.
针对K-means算法易受初始聚类中心影响而陷入局部最优的问题,提出一种基于萤火虫智能优化和混沌理论的FCMM算法。首先利用最大最小距离算法确定聚类类别值K和初始聚类中心位置;然后以各聚类中心为基准点,利用Tent映射构建混沌空间,通过混沌搜索更新聚类中心,以降低初始聚类中心过于临近的影响,并改善算法易陷入局部最优的问题。仿真结果表明,FCMM算法的平均聚类精度相较于经典K-means算法和FA算法分别提高了7.51%和2.2%,成功避免算法陷入局部最优解,提高了划分初始数据集的效率和寻优精度。  相似文献   

18.
针对k-medoids算法对初始聚类中心敏感,聚类精度较低及收敛速度缓慢的缺点,提出一种基于密度初始化、密度迭代的搜索策略和准则函数优化的方法。该算法初始化是在高密度区域内选择k个相对距离较远的样本作为聚类初始中心,有效定位聚类的最终中心点;在k个与初始中心点密度相近的区域内进行中心点替换,以减少候选点的搜索范围;采用类间距和类内距加权的均衡化准则函数,提高聚类精度。实验结果表明,相对于传统的k-mediods算法及某些改进算法,该算法可以提高聚类质量,有效缩短聚类时间。  相似文献   

19.
陈作平  叶正麟  刘明 《计算机工程》2006,32(12):191-192,195
KT均值聚类是经常使用的一种数据聚类方法,但对大数据量情形,其聚类过程较慢,主要原因在于聚类过程中每个待聚类向量要反复进行一个最近邻搜索过程,以寻找与其距离最近的聚类中心;据此,文章提出使用扩展的部分失真搜索(Extended Partial Distonion Search,EPDS)来完成该最近邻搜索,极大地减少了完成聚类所需乘法次数。实验表明,相对于基本的K均值聚类算法,该方法可以节约1/3以上的计算量。  相似文献   

20.
针对基于内容的音乐检索在查准率和查找效率上不能同时达到理想效果的情况,提出一种基于单侧连续匹配的分层聚类算法,即在匹配之前对音乐特征进行聚类。根据相似度值对特征空间进行分类,形成不同簇类,并对簇中心进行标记,再对聚类后的数据库进行精确匹配。实验表明,该方法不仅提高了音乐检索的效率,而且保证了较高的检索准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号