首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种基于SOM和K-means的文档聚类算法   总被引:9,自引:0,他引:9  
提出了一种把自组织特征映射SOM和K-means算法结合的聚类组合算法。先用SOM对文档聚类,然后以SOM的输出权值初始化K-means的聚类中心,再用K—means算法对文档聚类。实验结果表明,该聚类组合算法能改进文档聚类的性能。  相似文献   

2.
提出了一种把自组织特征映射SOM和Kmeans算法结合的聚类组合算法。先用SOM对文档聚类,然后以SOM的输出权值初始化Kmeans的聚类中心,再用Kmeans算法对文档聚类。实验结果表明,该聚类组合算法能改进文档聚类的性能。  相似文献   

3.
自组织映射算法是一种重要的聚类模型,能够有效提高搜索引擎的精确性。为克服自组织映射网络对于初始连接权值敏感的不足,提出一种改进的差分进化和SOM相结合的组合文档聚类算法IDE-SOM,首先引入一种改进的差分进化算法对文档集进行一次粗聚类,旨在对SOM网络的初始连接权值进行优化,然后将这个连接权值初始化SOM网络进行细聚类。仿真实验表明,该算法在F-measure、熵等评价指标上都获得了较好的聚类效果。  相似文献   

4.
一种基于群体智能的Web文档聚类算法   总被引:31,自引:0,他引:31  
将群体智能聚类模型运用于文档聚类,提出了一种基于群体智能的Web文档聚类算法,首先运用向量空间模型表示Web文档信息,采用常规方法如消除无用词和特征词条约简法则得到文本特征集,然后将文档的向量随机分布到一个平面上,运用基于群体智能的聚类方法进行文档聚类,最后从平面上采用递归算法收集聚类结果,为了改善算法的实用性,将原算法与k均值算法结合提出一种混合聚类算法,通过实验比较,结果表明基于群体智能的Web文档聚类算法具有较好的聚类特性,它能将与一个主题相关的Web文档较完全而准确地聚成一类。  相似文献   

5.
基于SOM算法实现的文本聚类   总被引:14,自引:0,他引:14  
张毓敏  谢康林 《计算机工程》2004,30(1):75-76,157
以自组织特征映射(Self-organizing map,SOM)算法作为理论基础,实现了对 文本文档的聚类,并且给出了相应的类别标注,同时对聚类的准确度进行了评价,由于准确 度较低而后提出了把tf·idf计算词权重的方法应用到SOM算法的输入文本向量中去,因此提 高了聚类的平均准确度。  相似文献   

6.
一种基于改进的自组织特征映射网络的文档聚类方法   总被引:2,自引:0,他引:2  
采用标准的自组织特征映射(Self—OrganizingFeatureMap)网络进行文档分类时存在着收敛速度慢、不同的初始条件及学习样本输入顺序影响学习过程和学习结果等缺点。针对这种情况,论文提出了一种改进的自组织特征映射网络文档分类方法,即采用自适应的方法建立网络拓扑结构,利用输入训练样本来确定网络中的连接权值,综合系统能量函数和训练次数作为判断网络的学习结束标准,并且取得了比较好的实验结果。  相似文献   

7.
一种基于SOM和PAM的聚类算法   总被引:4,自引:0,他引:4  
张钊  王锁柱  张雨 《计算机应用》2007,27(6):1400-1402
提出了一种基于自组织映射(SOM)算法和围绕中心点的划分(PAM)算法相结合的SOM-PAM聚类算法。该算法首先利用SOM算法对数据集进行“粗聚类”并得到簇数k;然后,根据簇数k再利用PAM算法对“粗聚类”结果进行聚类并得到最终聚类结果。通过实验表明,SOM-PAM算法具有比SOM算法更高的聚类效率和更好的聚类质量。  相似文献   

8.
Web文档聚类是web数据挖掘的重要任务之一,针对Web文档向量空间的高维性与数据聚类问题的最优化性质,采用LDA对文档向量空间进行降维,提出运用混合优化算法GA_PSO在此低维空间进行寻优,来发现Web文档集的最优簇结构.通过在真实数据集20Newsgroups的实验,结果表明我们的方法具有良好的聚类有效性,能较完全和准确地将主题相关的Web文档聚成一类.  相似文献   

9.
提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量空间模型中的特征项,利用TF-IDF方案计算基于短语的文档向量特征值。最后,使用K-means算法产生聚类结果。实验结果表明该方法优于传统K-means聚类算法和后缀树聚类算法,并具备了这些算法聚类速度快的优点。  相似文献   

10.
介绍了Web文档聚类中普遍使用的、基于分割的k-means算法,分析了k-means算法所使用的向量空间模型和基于距离的相似性度量的局限性,从而提出了一种改善向量空间模型以及相似性度量的方法。  相似文献   

11.
针对传统K-means算法存在的缺陷,引进人工鱼群算法,提出了一种基于改进鱼群和K-means的混合聚类算法。聚类样本中心点初始化时,人工鱼各维参数随机选择在对应属性两个极值之间,同时为了降低计算复杂度,提高收敛效率,寻找全局最优,首先对随机选取的一小部分人工鱼进行K-means操作,然后对全体人工鱼的追尾算子引入粒子群策略,引导其学习,模拟人工鱼的行为。通过Matlab仿真实现算法,在费雪鸢尾花卉数据集和葡萄酒质量数据集进行了实验,算法的有效性和可行性得到了验证。  相似文献   

12.
粒子群与K均值混合聚类的棉花图像分割算法   总被引:2,自引:0,他引:2  
棉花分割是采棉机器人视觉系统的关键步骤,在强光照、阴影等复杂的棉田环境下准确有效地分割棉花,有助于确定其在三维空间的位置。针对棉花图片的特点,提出在YCbCr颜色空间下,采用粒子群(PSO)和K均值混合聚类算法,提高了聚类算法的全局搜索能力,根据群体适应度方差来确定K均值聚类算法操作时机,增强算法局部精确搜索能力的同时缩短了收敛时间。通过对棉田环境中拍摄图像的分割实验表明:本方法对在阳光直射及阴影等干扰条件下的棉花图片也能准确分割,效果优于传统PSO和K均值算法。  相似文献   

13.
基于PSO的模糊C-均值聚类算法的图像分割   总被引:3,自引:0,他引:3  
根据粒子群优化算法(PSO)强大的全局搜索能力,提出了用PSO算法优化模糊C均值聚类(FCM)的聚类中心的方法,有效地避免了传统的FCM对初始值及噪声数据敏感,容易陷入局部最优的缺点,同时图像分割的效果也得到了提高,性能也比传统的FCM方法更加稳定。实验结果反映了该方法的有效性。  相似文献   

14.
分析了装备维修器材存储保障存在的问题,提出采用调剂供应缓解存储保障的资源失衡问题,充分利用存储过剩的超储器材补充库存短缺的需求单位,建立了装备维修器材调剂供应的多目标决策模型,采用[ε]-约束法对模型进行处理,基于引导因子设计了改进的粒子群优化算法(Particle Swarm Optimization,PSO)对模型求解,并通过仿真实例进行了验证。结果表明,采用调剂供应的方式,可使保障系统内的资源存储得到有效的平衡,装备维修器材的保障效率也有所提高。  相似文献   

15.
针对传统的模糊C-均值聚类算法对初始聚类中心较敏感、易陷入局部最优的缺点,将粒子群优化算法和FCM算法相结合,提出一种改进的模糊聚类算法。该算法利用粒子群算法的全局搜索能力代替FCM算法寻找初始聚类中心,使其跳出局部最优,实现模糊聚类。主要从反映数据集分类的类内紧致性程度和类间分离性程度的角度考虑,重新设计适应度函数。实验结果表明,提出的算法在聚类正确率和有效性指标上有更好的效果。  相似文献   

16.
在PSO算法的基础上提出的基于量子行为的QPSO算法,并将其应用到基因表达数据集上。QPSO基因聚类算法是将N条基因根据使TWCV(Total Within-Cluster Variation)函数值达到最小分到由用户指定的K个聚类中。根据K-means算法的优点,利用K-means聚类的结果重新初始化粒子群,结合QPSO和PSO的聚类算法提出了KQPSO和KPSO算法。通过在4个实验数据集上利用K-means、PSO、QPSO、KPSO、KQPSO 5个聚类算法得出的结果比较显示QPSO算法在基因表达数据分析上具有良好的性能。  相似文献   

17.
基于MPI的并行PSO混合K均值聚类算法   总被引:2,自引:0,他引:2  
传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算法的全局搜索能力,然后利用该算法提出一种新的并行聚类策略,并将该算法与K均值聚类算法、粒子群优化(PSO)聚类算法进行比较。实验结果表明,该算法不仅具有较好的全局收敛性,而且具有较高的加速比。  相似文献   

18.
针对标准粒子群优化(PSO)算法早熟收敛及易陷入局部极值的缺点,提出一种基于环形邻域的混沌粒子群优化算法RCPSO,并将其应用于求解数据聚类问题,而且通过在4个数据集上进行仿真实验验证了算法的有效性。实验表明,当邻域大小为整个种群规模的1/3时,基于静态邻域和基于随机邻域的算法在4个数据集上的整体聚类效果均达到最好。RCPSO算法利用适当规模的环形邻域提高了粒子群的全局寻优能力,并利用混沌因子增强了粒子收敛过程中种群的多样性,从而避免算法的早熟收敛。另外,与K-means、PSO、K-PSO及CPSO算法的实验结果进行比较表明,RCPSO算法在错误率方面表现得更好,因此该算法为聚类问题提供了一种切实有效的解决方法。  相似文献   

19.
为了解决虚拟企业中的任务分配问题,建立了任务分配的多目标决策优化模型。分析了传统的PSO算法,通过设置算法中速度惯性权重和加速度系数的自动调整,以及引入遗传算法中的变异操作,实现了对该算法的改进。基于改进的PSO算法求解任务分配模型,研究了求解问题与粒子的映射以及采用TOPSIS计算粒子位置适应度的方法,进而设计了一种基于改进PSO算法的任务分配算法。通过应用实例及仿真实验,证明了改进的PSO算法应用于任务分配的可行性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号