首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
为了提高大规模半结构化文档集的聚类质量,提出了一种新的XML文档聚类方法.从XML文档中提取层次路径序列,以此为依据将XML文档表示为VSM中的向量,将欧氏空间对应于粒子群模型的问题空间,采用粒子群聚类方法进行文档聚类.为了加速算法的收敛性,在算法的后续部分采用C-means进行快速局部调优,提出两阶段混合聚类方法,优点是能够跳出局部极值,搜寻整个问题空间的同时又保证了合理的时间.实验结果表明提出的方法具有较高的聚类准确性和较好的收敛程度.  相似文献   

2.
提出了一种改进的基于粒子群优化的快速K均值算法,有效克服了K均值算法对初始聚类中心敏感和容易陷入局部最优从而影响聚类效果等缺点.与已有的粒子群优化聚类算法相比,该算法通过对样本各维属性进行规范化,预先计算样本的相异度矩阵,提出了一种简化的粒子的编码规则,基于相异度矩阵进行粒子群优化K均值聚类,在保证聚类效果的基础上,有效降低了计算的复杂度.在多个UCI数据集上的实验结果表明,该算法是有效的。  相似文献   

3.
免疫接种粒子群的聚类算法   总被引:2,自引:0,他引:2  
将粒子群优化算法和K均值算法结合进行聚类分析,同时引入了免疫系统中的免疫接种和免疫选择机制来指导粒子的迭代过程,提出了一种基于免疫接种粒子群的聚类算法,在粒子群迭代的过程中加入免疫接种机制指导粒子的飞行方向,再通过免疫选择机制对接种的结果进行选择,确保粒子种群向更优的方向移动。实验结果证明,基于免疫接种粒子群的聚类算法基本克服了K均值算法容易受初始聚类中心影响的缺点,聚类结果稳定,而且比基于粒子群优化的聚类算法取得了更好的聚类效果。  相似文献   

4.
一种基于PSO的分割聚类算法   总被引:5,自引:0,他引:5  
为了求得一个数据集的最优分割,提出了一种基于PSO的分割聚类算法-PKPSO,将PSO算法和K均值聚类算法有效地结合在一起,对群体中的候选解有选择地利用K均值算法做进一步优化以提高解的精度。通过对算法的分析,给出了控制参数选择依据。并将此算法与单独使用K均值、PSO算法及QPSO算法聚类进行比较,试验测试结果表明:PKPSO算法有更好的全局收敛性,不仅能有效地克服传统算法易陷入局部极小值的缺点,而且求得解的精度和算法的稳定性都明显优于其他方法。  相似文献   

5.
提出一种基于粒子群算法的聚类算法,该算法利用粒子群算法随机搜索解空间的能力找到最优解.首先,将样本所属类号的组合作为粒子,构成种群,同时引入极小化误差平方和来指导种群进化的方向.其次,通过对全局极值的调整,搜索到全局最优值.最后,通过仿真实验的对比,验证了该算法在有效性和稳定性上要好于K-means算法.  相似文献   

6.
针对单一聚类算法存在的不能泛化的问题,将集成学习技术应用于聚类算法中,集成学习技术可以显著提高学习系统的泛化能力。提出了1种基于粒子群和遗传算法的协同进化聚类集成算法,粒子群算法保证算法快速收敛,遗传算法全局搜索扩大搜索范围,提高了聚类的性能和收敛速度。将本研究提出的算法在多个UCI数据集上进行试验验证,结果表明该算法是有效的。  相似文献   

7.
将Vague集引入模糊C-均值聚类目标函数,对其添加非隶属度信息,定义样本关于类的肯定隶属度函数和否定隶属度函数,并构造聚类中心表达式。采用粒子群优化算法求解该聚类目标函数,设计相应聚类算法,使其快速收敛于目标函数的全局最优解。对比实验结果表明,改进算法可以分割出目标轮廓并具有抗噪性。  相似文献   

8.
为满足海量数据处理要求,提出了一种基于网格的K-means快速聚类算法(SPGK).设计基于网格质心的聚类簇个数选取算法,对数据进行网格划分得到每个网格的质心,将质心作为K-means聚类的样本点,从而减少K-means的欧氏距离计算次数.该算法基于Spark平台实现并行计算,进一步地提高了算法的运行效率.SPGK不但能够获得良好的聚类效果,而且缩减了欧氏距离计算次数,适用于海量数据的快速聚类.在千万级数据集上的实验结果表明,SPGK的性能明显优于现有的K-means++和基于K均值聚类的递归划分方法.  相似文献   

9.
针对聚类数不确定的高维、大规模数据聚类问题,提出以粒子群优化算法为基础、引入克隆选择算子的聚类分析算法。该算法利用粒子群的优化搜索机制搜索聚类中心向量,并根据适应度高低控制粒子的克隆数量和变异幅度,达到有效避免陷入局部最优的目的,并能克服传统聚类算法对初始值敏感的缺点,提高了算法的稳定性。仿真实验结果表明,该算法不仅能正确得出聚类簇数,而且聚类正确率较对比算法提高了至少7.0%。  相似文献   

10.
利用模糊c均值(FCM)算法是一种最流行的模糊聚类的方法,因为它的效率,计算简单,容易实现.但是针对FCM对初始化敏感和易陷入局部最优解,在本文出了一种基于粒子群算法的模糊聚类.仿真实验结果表明了该方法对有效性和全局性优化.  相似文献   

11.
针对模糊C-均值算法(FCM)具有局部最优问题和初值敏感性的缺陷,将微粒群优化算法应用于文本模糊聚类, 提出了基于微粒群优化算法的模糊C-均值算法PFCM.该算法首先采用实数编码方式对聚类原型进行编码,利用微粒群优化算法的全局搜索性能对初始聚类原型的选取进行指导,然后利用模糊C-均值算法进行聚类.使用算法PFCM对文本集合进行聚类实验,并用目标函数值和划分系数来判断模糊划分的效果,实验结果表明,与FCM相比,该算法具有较好的全局收敛性和较好的聚类结果.  相似文献   

12.
针对大多数安全评估模型通用性差的问题,利用灰色聚类理论,建立了一个新的信息系统安全评估模型. 提出了采用灰色聚类决策对系统安全状态进行评估的方法,给出了系统安全状态的灰色分类,并构造了灰类的白化权函数. 结合具体实例说明了该模型的应用,并运用灵敏度概念,分析评估结果的稳定性和可靠性.  相似文献   

13.
针对大多数安全评估模型通用性差的问题,利用灰色聚类理论,建立了一个新的信息系统安全评估模型. 提出了采用灰色聚类决策对系统安全状态进行评估的方法,给出了系统安全状态的灰色分类,并构造了灰类的白化权函数. 结合具体实例说明了该模型的应用,并运用灵敏度概念,分析评估结果的稳定性和可靠性.  相似文献   

14.
作为数据挖掘的一项重要技术,聚类分析具有广泛的应用领域.同时,聚类也是数据挖掘领域中一个相对比较困难的问题.在聚类算法中,基于模糊划分的FCM算法是一种重要的算法.和其它的算法相比,FCM算法具有计算简单、运算速度快,且有比较直观的几何意义的优点,因此在图像处理、模式识别等领域得到了广泛的应用.和所有的c均值算法一样,FCM算法也是只用类中心来表示类,这样只是适合球状类型的簇.本文在目前FCM算法研究的基础上,讨论了传统FCM算法在原型初始化上的局限性.提出一种基于层次凝聚的改进算法,使之能够适用于不规则分布的数据.  相似文献   

15.
提出了一个基于密度和网格的子空间聚类算法.该算法运用启发式的密度连通思想来确定一维空间初始簇的生成,使用自底向上的搜索策略来发现存在子空间中的簇.实验结果表明,在处理高维数据时,在不牺牲算法的其他性能的同时提高了聚类的有效性,降低了对输入数据顺序及噪音数据的敏感性.  相似文献   

16.
针对无线传感器网络(WSN)中采用多跳分簇算法所带来的能耗不均衡问题,提出了一种利用粒子群优化的环状簇路由协议. 该协议采用粒子群算法将整个网络划分成间隔不等的同心圆,在各环内再分成若干扇区作为簇首选举的基本单位. 在每个扇区内,各节点根据到扇区中心的距离剩余能量来竞选簇首. 同时引入能级的概念,在很大程度上克服了簇首轮换速度过快造成网络开销过大以及轮换速度过慢造成单个节点过早死亡的缺点. 仿真结果表明,该协议有效地均衡了各环间的能耗,延长了网络寿命.  相似文献   

17.
一种用于信息安全的信息保障模型   总被引:4,自引:1,他引:4  
将一种信息安全(IFOSEC)模型扩展成为一个信息保障(IA)模型,用于指导信息安全研究、工程和教育。新模型包括四维度量:安全目标,信息流状态,安全保障,时间。将信息安全的保护范畴扩大到信息资产,并对可用性、完整性和机密性重新进行了定义,增加了新内涵;采用深度防御概念,在注重技术的同时,突出了人的因素,并强调了安全管理在系统生命期重要作用。时间维的引入,使该模型真正成为动态模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号