首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于分布模型的层次聚类算法   总被引:1,自引:0,他引:1  
提出了一种新的层次聚类算法,先对数据集进行采样,以采样点为中心吸收邻域内的数据点形成子簇,再根据子簇是否相交实现层次聚类。在层次聚类过程中,重新定义了簇与簇之间的距离度量,并以此为基础建立堆结构。利用估计数据点总体分布的思想,证明该算法将逼近最优解。实验结果表明,算法的聚类效果大大优于现有的聚类算法。  相似文献   

2.
针对并行化密度聚类的过程中,不同密度聚类簇边界点划分模糊,并且存在数据噪声,从而影响聚类性能,使聚类结果受制于局部最优影响的问题,提出一种基于MapReduce与优化布谷鸟算法的并行密度聚类算法。首先,该算法结合K-means中的近邻与逆近邻思路的策略KDBSCAN(K-means DBSCAN),通过计算各数据点的影响空间,以此重新定义基于密度的聚类(Density-based spatial dutering of apptications with noise,DBSCAN)算法中聚类簇的拓展条件,避免了不同密度聚类簇边界点划分模糊的问题;其次,结合KDBSCAN密度聚类中的近邻思想提出了一种可行的迭代性噪声点处理策略,减轻数据中噪声点对于聚类算法性能的影响;再次,提出基于传统布谷鸟算法的优化改进策略MCS(Majorization cuckoo search),通过衰减发现巢穴概率的权重,随着迭代搜寻次数的增加提升算法收敛速度,解决了聚类结果受制于局部最优的问题;最后,结合MapReduce提出了并行密度聚类策略MCS-KDBSCAN,通过并行化密度聚类算法运算,减轻了并行聚类...  相似文献   

3.
通过研究Hadoop平台和MapReduce编程框架,提出了一个基于MapReduce的并行遮盖文本聚类算法.遮盖算法提出了两个距离阈值T1,T2用来构建重叠子集,避免了传统聚类算法对噪声敏感的缺点.同时采用适当的快速近似距离度量,大大加快了聚类速度.实验表明该算法在MapReduce框架下有良好的集群加速性能,适合处理大规模的数据集.  相似文献   

4.
传统的K-means算法是一种常用的聚类算法,但它对于初始聚类中心敏感,容易受到"噪声"和孤立点的影响,由此提出了一种基于网格的二次K-means聚类算法.此算法先将空间划分为多个大小相等的网格,然后根据给定的密度阈值来计算出密集网格,对密集网格中的点进行初次聚类,将初次聚类结果的均值点作为第二次聚类的初始均值点,从而消除了"噪声"和孤立点的影响,并且保证了信息的完整,实验证明此算法是有效的.  相似文献   

5.
在讨论传统的入侵检测技术的基础上,结合移动Agent技术,提出一种基于移动Agent的入侵检测系统的模型。  相似文献   

6.
聚类分析是数据挖掘的关键技术之一,聚类分析的典型应用包括物种的分类和分生物学的基因分类。同时在数据分析、模式识别、市场分析、流行病分析等领域也有较深入的应用。聚类分析中的典型数据结构分为数据矩阵和相异度矩阵两种。文章重点分析了典型的几类聚类算法,并指出了每一类算法的优缺点,最后对聚类分析技术的发展进行了展望。  相似文献   

7.
数据挖掘中聚类算法比较研究   总被引:8,自引:0,他引:8  
聚类算法是数据挖掘中的核心技术,虽然聚类算法已被广泛深入的研究,但其应用在数据挖掘领域时间不长,其间产生了许多不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户、为了更好的使用这些算法,综合提出了评价聚类算法好坏的5个标准,基于这5个标准,对数据挖掘中近几年提出的常用聚类方法作了比较分析,以利于人们更容易、更快速的找到一种适用于特定问题的聚类算法。  相似文献   

8.
针对K均值聚类算法对类簇数目预先不可知及无法处理非凸形分布数据集的缺陷,提出基于进化思想的聚类算法及其类簇融合算法.该算法将K均值聚类算法嵌入进化聚类算法框架中,通过调整距离倍参,将数据逐渐划分,在此过程中自动确定类簇数目,提出基于最近距离的中间圆密度簇融合算法和基于代表类的中间圆密度簇融合算法,将相似度大的类簇进行融合,使得k值逐渐趋向真实值.实验表明,该方法具有良好的实用性.  相似文献   

9.
基于特征加权理论的数据聚类算法   总被引:1,自引:0,他引:1  
针对数据挖掘过程中数据聚类操作的初始聚类数目和初始聚类中心确定困难的问题,提出了一种软子空间结合竞争合并机制的模糊加权聚类算法.通过对软子空间聚类算法的目标函数进行改写,并结合数据簇势的大小对各数据簇进行竞争与合并操作,实现了对数据的聚类处理.结果表明,该算法能够准确地对数据样本进行聚类,并且聚类结果与初始数据簇数目和初始聚类中心无关,能够满足对高维数据聚类处理的需要,具有较好的实际应用价值.  相似文献   

10.
为解决现有的分布式聚类算法效率低下和不能保护数据隐私的问题,在K-Dmeans算法的基础上,提出一种新的分布式聚类算法.该算法利用数据对象间的密度函数值来优化站点初始聚类中心,从而大大降低了聚类的迭代次数;同时各从站点只需向主站点传送其聚簇的特征信息,有效降低分布式聚类过程中的通信量,保护了各个站点的独立性,实验结果表...  相似文献   

11.
路由算法的性能直接决定网络的效率及可用性,基于移动agent的路由算法可以有效地降低网络负载,较好地适应异构环境。首先介绍了建立分布式自适应路由系统的必要性,提出了用移动agent解决路由问题,讨论了改进的蚁群算法,并对今后探讨基于移动agent的分布式路由算法问题给出了进一步的工作设想。  相似文献   

12.
给出了基于微机网络并行计算环境的求解大型稀疏矩阵部分极端特征值问题AX=λX的重新开始块Davidson方法,各结点机利用矩阵A和相应的投影子空间的部分正交基进行运算,若扩充子空间V的基超过m时,则以最新的Ritz向量构成V,重新开始迭代。在Windows 2000环境下安装MPI,构成分布式微机网络并行计算环境,在该并行环境下的数值试验表明所给算法非常有效。  相似文献   

13.
为了提高移动P2P网络的覆盖层拓扑稳定性,提出一种基于节点移动特性的移动P2P网络分簇算法。该算法通过对移动P2P网络的覆盖层拓扑变化与节点移动特性的关系的研究,将具有相同运动特性且物理位置临近的节点聚集成簇,并选取性能较好的节点作为簇首,使得簇内节点能够最大程度的保持覆盖层拓扑结构的稳定性。最后通过实验验证了该算法的有效性。  相似文献   

14.
船舶电力系统建模及其并行算法实现   总被引:2,自引:0,他引:2  
提出了一种基于节点电压的建模方法。首次在船舶电力系统研究中引入并行计算。设计了一种适合船舶电力系统的并行算法。采用了国际上最先进的并行计算软件MPI进行缡程仿真。应用这种方法,成功地建立了某型船舶电力系统的数字仿真模型,并在仿真中实现了并行计算。通过结果分析。该方法建立的模型可以真实地反映实际系统,设计的并行算法可以提高仿真速度。  相似文献   

15.
基于MPI的并行蚁群算法的研究与实现   总被引:1,自引:0,他引:1  
在消息传递接口(message passing interface,MPI)的基础上,采用划分蚁群的策略,实现了基于MPI的并行蚁群算法,并对该算法采用旅行商问题进行了实验.实验结果表明,使用并行计算技术,可以很好地提高运行速度.  相似文献   

16.
基于移动代理技术的网络入侵检测系统   总被引:2,自引:0,他引:2  
分析了目前网络入侵检测技术的现状及存在问题。以移动代理技术为基础,提出了一种基于移动代理技术的网络入侵检测系统模型。本模型在充分利用基于主机的入侵检测系统的基础上,利用移动代理技术,克服传统入侵检测系统的弱点,提高检测系统的整体功能。  相似文献   

17.
将思维进化计算(Mind Evolutionary Computation,EC)的并行性和并行计算机的高速性相结合提出了基于MPI的主从式并行MEC.分析了该并行算法的任务分配、通信开销、子群体尺寸、个体评价时间和处理器数目对并行加速比的影响.  相似文献   

18.
随着对地观测技术的飞速发展,通过遥感卫星获得的数据量正在迅速增加,各种应急应用需求也在日益增长,通过与快速计算技术相结合,特别是与并行处理相结合能够显著提高整个影像的快速处理速度.从遥感影像系统级几何校正处理的特点以及对现在提出的各种并行技术MPI、OpenMP、TBB、CUDA进行分析,通过研究提出了相应的快速处理技...  相似文献   

19.
一个基于MPI网络并行计算的图形函数库   总被引:1,自引:1,他引:0  
简述了面积工作站群机系统的并行虚拟处理平台MPI及其编程要点,介绍了基于MPI开发的图形函数库,最后以计算机辅助曲线/曲面设计中常用的追赶法为例,详细说明了针对工作站群机系统设计的并行算法。  相似文献   

20.
数据聚类是数据挖掘中的关键一步.本文针对利用欧几里德距离作为相似性测算引起聚类结果的不稳定性,提出一种基于内聚力作为相似性测算的聚类方法.通过仿真比较,证明了该算法的优越性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号