首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
提出融合K均值与改进磷虾群算法的多目标文本聚类算法。利用K均值的局部快速寻优和改进磷虾群的全局搜索能力,以K均值聚类解作为改进磷虾群的初始种群,引入遗传交叉和变异改善个体多样性,提升全局搜索能力;通过磷虾种群的诱导运动、觅食运动和随机扩散进行位置更新,引入余弦相似度和欧氏距离的多目标适应度函数评估磷虾位置优劣,搜索全局最优解。通过基准数据集实验确定磷虾群算法的关键参数,进行系统聚类测试,实验结果表明,该算法在聚类指标上表现更佳,聚类准确性更高,收敛速度更快。  相似文献   

2.
针对K均值算法的缺陷,提出一种用于解决聚类问题的差分进化算法对聚类的准则函数进行优化,为了能够进一步增强算法的全局搜索能力,引入一种基于种群适应度方差的自适应策略来动态调整变异概率CR和规模因子F等参数,充分利用在Weka工具中的类和接口,并将新提出的算法嵌入到平台中.在Weka平台上将该算法与K均值算法在3个UCI数据集上进行比较.仿真实验结果表明,该算法能够有效克服K均值算法的缺陷,能够获得较高的聚类质量.  相似文献   

3.
基于模拟退火与K均值聚类的入侵检测算法   总被引:4,自引:0,他引:4  
K均值聚类算法时初始值的选取依赖性极大,易陷入局部极值.为此,结合模拟退火算法和K均值聚类思想,提出一种新的入侵检测方案.算法利用模拟退火算法时聚类分析中的聚类准则进行优化,以获得全局最优解,并进一步开拓模拟退火算法的并行性以加快算法收敛速度.在KDD CUP 1999上进行了仿真测试,实验结果表明该方案优于基于K均值聚类的入侵检测算法,有较低的误检率与虚警率.  相似文献   

4.
针对K均值聚类算法存在的对初始值敏感且容易陷入局部最优的缺点,提出一种改进的混合蛙跳算法(SFLA)和K均值相结合的聚类算法。该算法通过混沌搜索优化初始解,变异操作生成新个体,在更新青蛙位置时,设计了一种新的搜索策略,提高了算法寻优能力;根据青蛙群体的适应度方差来确定K均值算法的操作时机,抑制早熟收敛。实验结果表明,改进的算法提高了聚类精度,在全局寻优能力和收敛速度方面具有优势。  相似文献   

5.
针对用模糊C-均值聚类算法选择初始聚类中心敏感及模糊加权指数m对模糊C-均值聚类算法的聚类性能影响较大等问题,利用粒子群优化算法的全局寻优能力强及收敛速度较快的特点,结合模糊C-均值算法提出一种新的模糊聚类算法;采用了一种简单有效的粒子编码方法,将初始聚类中心和模糊加权指数m同时进行粒子群优化搜索,在得到最优适应度的同时,m也收敛到一个稳定的最优解,从而有效地解决了上述问题。算法在人工合成数据集和多个UCI数据集上都取得了较好的效果。  相似文献   

6.
一种用于文本聚类的改进的K均值算法   总被引:2,自引:0,他引:2  
K均值算法是聚类分析中使用最为广泛的算法之一.针对文本聚类所面临的维数灾难,稀疏向量以及标准K均值算法初始中心点选择的随机性等问题,提出了一种面向文本聚类的改进的K均值算法,通过运用特征选择及降维、稀疏向量筛除、基于密度及散布的初始中心点搜索等方法进行改进.实验结果表明,改进后的算法无论在聚类精度还是在稳定性等方面,都明显优于标准的K均值算法.  相似文献   

7.
利用粒子群优化(PSO)算法全局寻优的特点,很大程度上避免了模糊C-均值聚类(FCM)算法对初值敏感、易陷入局部收敛的缺陷.利用收敛速度快的K均值聚类法得到的聚类中心作为PSO算法初始聚类中心的参考,提出一种新的模糊C-均值聚类算法Improved PSO FCM.实验结果表明,论文算法提高了FCM的搜索能力,聚类更为准确,效率更高.  相似文献   

8.
针对传统的模糊C-均值聚类算法对初始聚类中心较敏感、易陷入局部最优的缺点,将粒子群优化算法和FCM算法相结合,提出一种改进的模糊聚类算法。该算法利用粒子群算法的全局搜索能力代替FCM算法寻找初始聚类中心,使其跳出局部最优,实现模糊聚类。主要从反映数据集分类的类内紧致性程度和类间分离性程度的角度考虑,重新设计适应度函数。实验结果表明,提出的算法在聚类正确率和有效性指标上有更好的效果。  相似文献   

9.
文本聚类是中文文本挖掘中的一种重要分析方法.K均值聚类算法是目前最为常用的文本聚类算法之一.但此算法在处理高维、稀疏数据集等问题时存在一些不足,且对初始聚类中心敏感.本文针时这些不足,提出了用特征词向量空间模型来降低向量的维数;并提出一种新的优化初始聚类中心的算法,即根据文章的特征词选择有代表性的初始聚类中心.实验表明特征词向量空间模型和优化初始聚类中心的算法能降低计算复杂度,增强结果的稳定性,并产生质量较高的聚类结果.  相似文献   

10.
文本信息中包括许多无用特征,这种噪声特征会影响文本聚类效果,为此提出一种基于粒子群优化的文本特征选择算法.利用词频逆文本频率指数为目标函数评估每个文档的文本特征,从初始文档数据集中求解新的有用特征最优子集;以该最优有用特征子集作为K均值聚类的输入进行文本聚类,得到最优文本聚类结果.利用文档数据集进行聚类测试,其结果表明,在多项评估指标上算法表现得更加优秀,在特征选择规模上降低了初始文档特征规模.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号