首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
AntClust是一种新的基于蚂蚁化学识别系统的聚类算法.但它在初始化参数、行为规则等方面存在不足.通过定义新的聚类中心、相似度计算方法、小巢删除规则以及修改行为规则,对其进行改进.实验结果表明,改进算法能有效的提高聚类质量.  相似文献   

2.
针对经典K-means聚类算法存在易陷入局部最优解的缺点,提出并实现了一种基于Hadoop的改进型遗传聚类算法.该算法利用遗传算法具有全局性和并行性的特点去处理K-means聚类算法易陷入局部最优的缺点,在此基础上对遗传算法进行改进,然后将改进后的遗传算法与K-means算法相结合,为提高算法执行效率,将其基于Hadoop平台进行了实现.通过实验将该改进方法与经典聚类算法进行对比分析,实验结果表明该方法在聚类准确性和聚类效率上均有较大的提高.  相似文献   

3.
针对粒子对算法存在过早陷入局部最优导致聚类精度不高以及聚类结果对初始粒子比较敏感等问题,提出了一种新的基于粒子对(PPO)与差分进化(DE)混合算法。该混合算法结合PPO和DE的优点,根据一定的迭代次数在精英粒子对迭代过程中引入DE算法,借助DE算法的全局收敛能力避免PPO算法过早陷入局部最优的缺点,并借助K-means快速聚类的结果和PSO聚类结果初始化粒子位置,提高初始粒子的质量从而提高聚类结果精度。将混合算法应用于真实的基因表达数据,实验结果表明,混合算法比K-means和PPO算法具有更好的聚类结果和稳定性。  相似文献   

4.
针对EM算法中的初始类的数目很难决定,在迭代中经常产生部分最优的情况,将K-means算法与基于EM的聚类方法相结合,提出了一个新的适用于基因表达数据的模型聚类方法。新的聚类方法,首先利用K-means算法具有全局性、效率高的优点,快速得到聚类的起始类的划分,将其设置为高斯混合模型的初始参数值,进一步采用EM方法进行聚类,得到最优聚类结果。通过2次对真实数据集的实验测试,将新的算法分别与K均值算法和EM算法进行了比较。实验结果表明,新算法是一种有效的聚类方法,聚类结果的准确度得到了提高。  相似文献   

5.
提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量空间模型中的特征项,利用TF-IDF方案计算基于短语的文档向量特征值。最后,使用K-means算法产生聚类结果。实验结果表明该方法优于传统K-means聚类算法和后缀树聚类算法,并具备了这些算法聚类速度快的优点。  相似文献   

6.
提出一种基于减聚类、K-means算法及改进的粒子群优化(PSO)算法的径向基函数(RBF)神经网络混合学习算法. 该算法首先使用减聚类确定隐层节点数和K-means初始聚类中心; 然后通过K-means算法求取RBF网络所有参数, 作为PSO的初始粒子群; 为了提高PSO算法的收敛性和稳定性, 对基本PSO算法进行了优化改进, 最后使用改进的PSO算法训练RBF神经网络中的所有参数. 对IRIS数据集分类识别的仿真结果表明, 改进的混合算法具有更高的分类准确率和更好的稳定性.  相似文献   

7.
海沫  张游 《计算机科学》2017,44(Z6):414-418
通过实验,从运行时间、加速比、可扩展性和规模增长性4个方面比较了 Spark平台中3种典型的聚类算法即K-means聚类算法、二分K-means聚类算法和高斯混合聚类算法 的性能。实验结果表明:1)随着节点个数的增加,3种算法对百兆以上规模数据集聚类的运行时间明显减少;2)当数据集规模大于500MB时,3种算法的加速比均有明显提高,且随着节点个数的增加,加速比近似于线性增长;3)3种算法的可扩展性随着节点个数的增加而降低,当数据集规模大于500MB时,相对于K-means和高斯混合算法,二分K-means算法的可扩展性最差;4)当数据集规模大于100MB时,高斯混合算法的规模增长性远高于K-means和二分K-means算法。  相似文献   

8.
基于粒子对和极值优化的基因聚类混合算法研究   总被引:1,自引:1,他引:0  
针对粒子对算法存在过早陷入局部最优导致精度不是很高的问题,建议了一种新的基于粒子对(PPO)与极值优化(EO)混合算法。该算法利用PPO和EO的优点,借助K-means快速聚类的结果初始化其中一个粒子,并根据一定迭代次数在精英粒子对的迭代过程中引入EO算法,在保证算法收敛的同时避免后期过早陷入局部最优,从而提高聚类结果的精度。将混合算法应用于真实的基因表达数据。实验结果表明,混合算法比K-means和粒子对算法具有更好的聚类精度和稳定性。  相似文献   

9.
传统K-means算法对初始聚类中心选择较敏感, 结果有可能收敛于一般次优解, 为些提出一种结合双粒子群和K-means的混合文本聚类算法。设计了自调整惯性权值策略, 根据最优适应度值的变化率动态调整惯性权值。两子群分别采用基于不同惯性权值策略的粒子群算法进化, 子代间及子代与父代信息交流, 共享最优粒子, 替换最劣粒子, 完成进化, 该算法命名为双粒子群算法。将能平衡全局与局部搜索能力的双粒子群算法与高效的K-means算法结合, 每个粒子是一组聚类中心, 类内离散度之和的倒数是适应度函数, 用K-means算法优化新生粒子, 即为结合双粒子群和K-means的混合文本聚类算法。实验结果表明, 该算法相对于K-means、PSO等文本聚类算法具有更强鲁棒性, 聚类效果也有明显的改善。  相似文献   

10.
K-均值聚类算法(K-means)是基于划分的聚类算法中的典型算法,针对K-means算法初始聚类中心存在对K依赖的缺陷,提出一种新的选取K-means算法初始聚类中心的方法,该方法提高聚类结果的有效性和稳定性;还提出一种极值选择法,将最大距离法和最小距离法相结合,进一步提高初始聚类中心选择的准确性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号