首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
模糊K-Prototypes(FKP)算法能够对包含数值属性和分类属性相混合的数据集进行有效聚类,但是存在对初始值敏感、容易陷入局部极小值的问题.为了克服该缺点,提出了一种基于粒子群优化(PSO)算法和FKP算法的混合聚类算法,先利用PSO算法确定FKP的初始聚类中心,再将PSO聚类结果作为后续FKP算法的初始值.实验结果表明,新算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法.  相似文献   

2.
针对一种特定类型高属性维数据———区间变量型高属性维稀疏数据聚类问题,提出高属性维稀疏信息系统,稀疏特征编码,基于二进制数计算相似度概念,给出一种新的基于二进制数计算相似度的高属性维稀疏数据聚类算法,由于计算属性稀疏特征相似度所采用的是二进制数布尔AND运算,因此,相比目前人们所使用的聚类算法,它是一种计算简单、精度高、聚类质量较高的聚类算法。该算法在高属性维稀疏数据挖掘及聚类分析中有着重要的应用。通过数值算例分析表明该聚类方法有效。  相似文献   

3.
Affinity Propagation(AP)聚类算法将所有数据点作为潜在的聚类中心,在相似度矩阵的基础上通过消息传递进行聚类.与传统聚类方法相比,对于规模很大的数据集,AP是一种快速、有效的聚类方法.正是这样,属性约简对于AP算法非常重要.另外,在大规模并行系统的设计中,细粒度并行是实现高性能的基本策略.提出了一种基于改进属性约简的细粒度并行AP聚类算法(IRPAP),将粒度思想引入到并行计算中.首先分析了并行计算中的粒度原理.然后用改进的属性约简算法对数据集预处理.此算法并行计算并选择差别矩阵元素,降低了时间空间复杂度,最后用AP算法聚类.整个IRPAP算法将任务划分到多个线程同时处理.实验证明,对于大规模数据集的聚类,IRPAP算法比AP算法效率更高.  相似文献   

4.
由于当今的网络数据是海量的,因此科研人员对某些问题进行研究时需要将不同属性的数据从中提取出来,然而在提取这些数据之前需要将相同数据进行聚类。数据聚类的过程,也就是寻找数据最优属性的过程,然而人工蚁群就是一种寻找问题最优解的算法,因此在本文中再次将蚁群算法在聚类中进行应用。由本文提出的聚类算法可以分为两个部分,第一部分是:通过相似性算法来衡量数据之间的相似度,第二部分是:根据第一部分的计算结果,再采用蚁群算法为需要聚类的数据选择不同的聚类中心,从而对不同属性的数据进行聚类,经过以上两个过程的计算,可以实现对数据的聚类。在本文中进行数据聚类时采用的相似性度量来代替距离的计算,是本文创新点之一,采用蚁群算法在聚类过程中来选择聚类中心也是本文的创新所在。  相似文献   

5.
基于改进的粒子群算法和信息熵的知识获取方法   总被引:3,自引:0,他引:3  
针对粒子群优化算法(PSO)易陷入局部优化的问题,在PSO算法加入交叉变异算子,克服了标准PSO算法易陷入局部最优的不足;并将改进的PSO算法和模糊C-均值聚类相结合,提出了一种新的模糊聚类算法CMPSO-FCM,该算法具有良好的搜索能力和聚类效果.进而将聚类得到的属性隶属矩阵用于属性约简,并提出一种基于信息熵的模糊粗糙集知识获取的方法.实验和实例分析表明该方法的正确性和有效性.  相似文献   

6.
传统K-Modes算法的一个主要问题是属性选择问题。K-Modes算法在聚类过程中对每一个属性都同等看待,而在实际应用中,很多数据集仅有几个重要属性对聚类起作用。为了考虑不同属性对聚类的不同影响,将K-Modes聚类算法与属性权重的最优化结合起来,提出一种属性自动赋权的FW-K-Modes算法。该算法不仅可以提高传统K-Modes聚类算法的聚类精度,还能分析各维属性对聚类的贡献程度,实现关键属性的选择。对多个UCI数据集进行了实验,验证了该算法的优良特性。  相似文献   

7.
PAM是最早提出的k-medoids算法之一,该算法比较健壮,比k-means算法鲁棒性更强,但是PAM对初始值敏感,易陷入局部收敛。利用PSO算法对PAM进行优化,提出一种基于PSO和PAM的聚类方法,充分利用PAM和PSO两者对于不同问题的优势,来不断地更新PAM的聚类中心。通过建立基于熵的聚类有效性函数,对混合聚类算法的性能进行客观评价。从来自UCI的数据的测试结果表明,这种混合聚类的方法有较高的聚类正确率。  相似文献   

8.
基于MPI的并行PSO混合K均值聚类算法   总被引:2,自引:0,他引:2  
传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算法的全局搜索能力,然后利用该算法提出一种新的并行聚类策略,并将该算法与K均值聚类算法、粒子群优化(PSO)聚类算法进行比较。实验结果表明,该算法不仅具有较好的全局收敛性,而且具有较高的加速比。  相似文献   

9.
聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同种类.目前聚类分析算法普遍存在对初始参数敏感,难以找到最优聚类以及聚类有效性等问题.人工鱼群算法作为一种新型仿生优化算法,具有良好的克服局部极值和获得全局极值的能力.引入聚类数学模型,结合现有人工鱼群算法的特点和聚类算法理论,通过模拟鱼群的智能行为进行聚类分析,提出了一种基于人工鱼群算法的聚类挖掘方法.对空间数据的实验和蚁群算法的对比研究表明,该算法具有良好的聚类效果.  相似文献   

10.
为了提高蚁群化学聚类算法的聚类效果,通过引入径向基核函数改进蚁群化学聚类算法的相似度度量式,提出了核蚁群化学聚类算法。将核蚁群化学聚类算法用于三个标准数据集合,计算结果表明与蚁群化学聚类算法相比,核蚁群化学聚类算法聚类效果提升显著。将核蚁群化学聚类算法、核自组织神经网络映射算法和基于多项式核的结构化有向树数据聚类算法同时用于Iris数据集合,结果显示三种核聚类算法聚类效果相当。  相似文献   

11.
针对基于粒子群的模糊聚类算法以隶属度编码时对噪音敏感,以及处理样本数小于样本维数的数据集效果较差等问题,通过改进其中的模糊聚类约束方法,提出一种改进的基于粒子群的模糊聚类方法.当样本对各类的隶属度之和不为1时,新方法在粒子群优化得出的隶属度基础上,根据样本与各类之间的距离对隶属度进一步分配,以使隶属度满足模糊聚类约束条件.新方法显著地改善了在隶属度编码下使用粒子群进行模糊聚类的效果,并通过典型的数据集进行了验证.  相似文献   

12.
在PSO算法的基础上提出的基于量子行为的QPSO算法,并将其应用到基因表达数据集上。QPSO基因聚类算法是将N条基因根据使TWCV(Total Within-Cluster Variation)函数值达到最小分到由用户指定的K个聚类中。根据K-means算法的优点,利用K-means聚类的结果重新初始化粒子群,结合QPSO和PSO的聚类算法提出了KQPSO和KPSO算法。通过在4个实验数据集上利用K-means、PSO、QPSO、KPSO、KQPSO 5个聚类算法得出的结果比较显示QPSO算法在基因表达数据分析上具有良好的性能。  相似文献   

13.
一种基于改进PSO的K—means优化聚类算法   总被引:1,自引:0,他引:1  
针对传统的K—means算法对初始聚类中心的选取敏感、容易收敛到局部最优的缺点,提出一种基于改进粒子群优化算法(PSO)的K—means优化聚类算法。该算法利用PSO算法强大的全局搜索能力对初始聚类中心的选取进行优化:通过动态调整惯性权重等参数增强PSO算法的性能;利用群体适应度方差决定算法中前部分PSO算法和后部分K—means算法的转换时机;设置变量实时监控各个粒子和粒子群的最优值变化情况,及时地对出现早熟收敛的粒子进行变异操作,从而为K—means算法搜索到全局最优的初始聚类中心,使聚类结果不受初始聚类中心影响,易于获得全局最优解。实验结果表明文中提出的改进算法与传统聚类算法相比具有更高的聚类正确率、更好的聚类质量及全局搜索能力。  相似文献   

14.
李锋 《微机发展》2014,(12):138-141
目前模糊C均值聚类算法广泛应用于入侵检测算法中,但是存在聚类数目难以确定,目标函数的局部极小点使得算法容易陷入局部最优的现象,影响入侵检测的准确率。鉴于此,文中提出一种基于粒子群算法的模糊聚类算法,引入PSO全局搜索能力和粒子翻转变异操作,避免传统C均值聚类算法对孤立点敏感,容易陷入局部最优,过早收敛的问题。最后通过实验结果表明,新算法检测率明显优于C均值聚类算法,能很好地应用于目前入侵检测系统之中。  相似文献   

15.
李亚非  曹长虎 《计算机工程》2011,37(16):167-169
为充分发挥粒子群优化算法和遗传算法各自的优势,提出一种新的基于粒子群和遗传算法的协同进化算法,并将其应用于聚类分析。通过构建2个相互竞争的种群,采用相对适应度度量方法,在一个纯自举的过程中产生最优竞争个体。在现实世界数据集上的仿真实验表明,该算法在收敛精度方面优于基于遗传算法的聚类方法和基本粒子群优化聚类算法。  相似文献   

16.
潘烁  王曙燕  孙家泽 《计算机应用》2012,32(4):1165-1167
在解决组合测试中的测试数据集生成问题时,粒子群优化算法(PSO)在待测数据量增加达到一定程度以后,出现迭代次数增加、收敛速度减慢的缺点。针对该问题,提出了一种应用于组合测试数据集生成问题的基于K-均值聚类的粒子群优化算法。通过对测试数据集合进行聚类分区域,增强测试数据集的多态性,从而对粒子群优化算法进行改进,增加各个区域内粒子之间的影响力。典型案例实验表明该方法在保证覆盖度的情况下具有一定的优势和特点。  相似文献   

17.
提出了一种新的基于模糊粒子群算法的电力变压器故障自动识别方法。首先对基于油中溶解气体分析得到五种关键气体含量数据进行特殊预处理,得到识别四种故障需要的六个关键特征。然后给出了一个新的模糊聚类目标函数,在此基础上,根据已有的故障样本利用粒子群算法得到各类故障的最优聚类中心;并由此计算出各测试样本到各个聚类中心之间的距离以及相应的隶属度,最后识别出样本的变压器故障类型。测试结果显示,该方法能有效诊断识别出变压器高能放电、过热、低能放电和正常状态,精度可达92%。  相似文献   

18.
已有的粒子群模糊聚类算法需要设置粒子群参数并且收敛速度较慢,对此提出一种基于改进粒子群与模糊c-means的模糊聚类算法。首先,使用模糊c-means算法生成一组起始解,提高粒子群演化的方向性;然后,使用改进的自适应粒子群优化方法对数据进行训练与优化,训练过程中自适应地调节粒子群参数;最终,采用模糊c-means算法进行模糊聚类过程。对比实验结果表明,所提方法大幅度提高了计算速度,并获得了较高的聚类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号