首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 249 毫秒

1.  聚类算法初始聚类中心的优化  
   顾洪博  张继怀《西北纺织工学院学报》,2010年第2期
   对近年来k-means算法的研究现状与进展进行总结.首先对较有代表性的初始聚类中心改进的算法,从思想、关键技术和优缺点等方面进行分析.其次选用知名数据集对典型算法进行测试,主要从就同一个数据集不同改进算法的聚类情况进行对比分析,为聚类分析和数据挖掘等研究提供有益的参考.    

2.  不确定性数据的聚类分析研究及应用  
   顾洪博  张继怀《河北煤炭建筑工程学院学报》,2012年第1期
   对近年来不确定性数据聚类算法的研究现状与进展进行总结。首先对较有代表性的聚类算法,从思想、关键技术和优缺点等方面进行分析。其次选用数据集对基于密度的算法进行测试和对比分析。并给出基于不确定性数据的聚类算法,上述工作将为不确定数据管理提供有益的参考。    

3.  数据挖掘算法性能优化的研究与应用  
   顾洪博  赵万平《长春理工大学学报(自然科学版)》,2010年第33卷第1期
   数据挖掘中经常使用k-means算法,它是经常使用的一种聚类分析算法,但易受初始聚类中心和聚类个数k的影响。因此对近年从算法原理、关键技术和优缺点等方面提出的较有代表性的关于初始聚类中心和k值确定的改进的k-means算法进行了分析。并选用知名数据集对一些典型算法进行测试和应用。上述工作将为数据挖掘的研究提供有益的参考。    

4.  结合降维技术的电力负荷曲线集成聚类算法  被引次数:1
   张斌  庄池杰  胡军  陈水明  张明明  王科  曾嵘《中国电机工程学报》,2015年第15期
   电力负荷曲线聚类是配用电大数据挖掘的基础。分析3种典型聚类有效性指标,指出Davies-Bouldin有效性指标更适用于评估负荷曲线的聚类结果。研究基于层次、基于划分、基于密度、基于模型等类型的聚类算法,从聚类效率和聚类质量两方面评价各种算法。层次聚类的质量较高,效率较低;划分聚类的效率较高,质量较低。针对单一聚类算法的不足,研究基于经典聚类算法的集成聚类算法并将其应用于负荷曲线聚类。该算法包括bootstrap重采样、划分聚类、层次聚类3步,对不同规模数据集的聚类结果表明集成算法具有更好的性能,特别适用于大规模数据集聚类。针对电力负荷曲线的特征,研究多种数据集降维算法,在降维后的数据集上进行集成聚类,比较各种降维算法的信息损失和计算效率。研究结果表明,对于大规模电力负荷曲线的聚类问题,结合主成分分析降维的集成聚类算法可以取得最佳效果。    

5.  聚类算法研究综述  
   陈新泉  周灵晶  刘耀中《集成技术》,2017年第6卷第3期
   聚类是数据挖掘研究领域的一种重要数据预处理方法,其目的是从无标签数据集中获得有价值数据集的内在分布结构,进而简化数据集的描述.历经几十年的研究,针对不同应用和数据特性己出现了千余种不同的聚类算法,但不同的聚类算法都有其特定的适用范围和不足.传统的聚类算法大致可分为划分聚类方法、层次聚类方法、密度聚类方法、网格聚类方法、模型聚类方法等.通过对传统聚类方法的回顾和总结,文章重点介绍了近年来出现的同步聚类算法、信念传播聚类算法和密度峰值聚类算法,并针对以上聚类算法的应用及发展方向进行了论述.    

6.  聚类算法综述  
   伍育红《计算机科学》,2015年第42卷第Z6期
   数据挖掘技术可以从大量数据中发现潜在的、有价值的知识,它给人们在信息时代所积累的海量数据赋予了新的意义。随着数据挖掘技术的迅速发展,作为其重要的组成部分,网格聚类技术已经被广泛应用于数据分析、图像处理、市场研究等许多领域。网格聚类算法研究已经成为数据挖掘研究领域中非常活跃的一个研究课题。 介绍了数据挖掘理论,对网格聚类算法进行了深入的分析研究。在研究了传统网格聚类算法的基础上,提出了一些改进的网格聚类算法,这些算法相比传统网格聚类算法有更好的聚类质量和效率。在分析了传统的多密度聚类算法的基础上,提出了基于网格的多密度聚类算法(Grid-based Clustering Algorithm for Multi-density)[1],该算法主要采用密度阈值递减的多阶段聚类技术提取不同密度的聚类,同时对聚类结果进行了人工干预。研究结果表明,基于网格的多密度聚类算法不仅能够对数据集进行正确的聚类,同时还能有效地弥补孤立点检测,有效地解决了传统多密度聚类算法不能有效识别孤立点和噪声的缺陷。基于网格的多密度聚类算法比传统的共享近邻SNN算法精度高,适合于均匀密度数据集、大部分多密度数据集,并且可以发现任意形状的聚类,对噪声数据和数据输入顺序不敏感,但对小部分多密度数据集的聚类结果不理想[1]。    

7.  从多角度分析现有聚类算法  被引次数:53
   钱卫宁  周傲英《软件学报》,2002年第13卷第8期
   聚类是数据挖掘中研究的重要问题之一.聚类分析就是把数据集分成簇,以使得簇内数据尽量相似,簇间数据尽量不同.不同的聚类方法采用不同的相似测度和技术.从以下3个角度分析现有流行聚类算法: (1)聚类尺度; (2)算法框架; (3)簇的表示.在此基础上,分析了一些综合或概括了一些其他方法的算法.由于分析从3个角度进行,所提出的方法能够涵盖,并区分绝大多数现有聚类算法.所做的工作是自调节聚类方法以及聚类基准测试研究的基础.    

8.  数据挖掘中聚类分析的技术方法  被引次数:1
   梁志荣《电脑开发与应用》,2007年第20卷第6期
   数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析是数据挖掘中的核心技术。对各种聚类算法进行了分类,对代表算法作了详细的分析,并对这些算法从多个方面进行了比较,从而为研究和在不同领域使用这些算法提供了参考。同时还阐述了聚类分析在数据挖掘中的应用。    

9.  云计算环境下高复杂度动态数据的增量密度快速聚类算法研究  
   陈赣浪  颜飞龙  潘家辉《计算机科学》,2018年第45卷第2期
   针对传统的聚类算法存在开销大、聚类质量差、聚类速度慢等问题,提出一种新的云计算环境下高复杂度动态数据的增量密度快速聚类算法。首先,依据密度对云计算环境下高复杂度动态数据进行聚类,从数据空间中找到部分子空间,使得数据映射至该空间后可产生高密度点集区域,将连通区域的集合看作聚类结果;其次,通过DBSCAN算法进行增量聚类,并对插入或删除数据导致的原聚类合并或分裂进行研究;最后,在更新的过程中通过改变核心状态数据的邻域中含有的全部核心数据进行处理,从插入或删除数据两方面进行增量聚类分析。实验结果表明,所提算法开销低、聚类速度快、聚类质量高。    

10.  一种基于相容关系的聚类算法*  
   万仁霞  王立新  刘振文  苏晓珂《计算机应用研究》,2009年第26卷第4期
   聚类分析是数据挖掘中一个重要研究内容。传统的聚类算法可划分为硬聚类和模糊聚类两大类,提出一种基于对象集上的相容关系的聚类算法,该算法通过极大相容簇来对数据对象集进行分类,使得同一对象可以属于不同的簇,而每个簇又有自己独有的成员对象,从而得到既不同于硬聚类也不同于模糊聚类的聚类效果。实验进一步表明了该算法的聚类的合理性。    

11.  不同相似度测量方式的模糊C均值聚类分析  
   李中  苑津莎《计算机工程与应用》,2011年第47卷第18期
   聚类技术是机器学习、模式识别及数据挖掘等领域中的一个重要研究内容。采用不同相似度测量方式,应用标准模糊C均值聚类算法在UCI的三个知名数据集上完成聚类实验,从正确率和运行效率两个方面对比分析其性能,为聚类分析研究提供了有益的参考。    

12.  基于P2P网络的分布式聚类算法研究分析  被引次数:2
   杨柳  钟诚  陆向艳《微电子学与计算机》,2009年第26卷第8期
   在简要介绍传统聚类方法的基础上,从算法思想方面对近年来提出的分布式聚类算法、P2P网络上比较有代表性的聚类算法进行分析和评述,以期为进一步研究P2P网络环境下的聚类分析和数据挖掘方法提供有益的参考.    

13.  子空间聚类算法的研究新进展  
   陈慧萍  王煜  王建东《计算机仿真》,2007年第24卷第3期
   高维数据聚类是聚类技术的难点和重点,子空间聚类是实现高维数据集聚类的有效途径,它是在高维数据空间中对传统聚类算法的一种扩展,其思想是将搜索局部化在相关维中进行.该文从不同的搜索策略即自顶向下策略和自底向上策略两个方面对子空间聚类算法的思想进行了介绍,对近几年提出的子空间聚类算法作了综述,从算法所需参数、算法对参数的敏感度、算法的可伸缩性以及算法发现聚类的形状等多个方面对典型的子空间聚类算法进行了比较分析,对子空间聚类算法面临的挑战和未来的发展趋势进行了讨论.    

14.  小波域非Bayesian滤波方法研究  
   魏文畅  杨俊杰  蔡建立《计算机工程与应用》,2009年第45卷第4期
   对近几年来小波域滤波方法的研究现状与新发展进行归纳总结。一方面从算法思想,原理和优缺点等角度对近年来所提出的较有代表性的小波滤波算法进行分析概括;另一方面选择一些典型的滤波算法和一些常用的信号,主要从信噪比(SNR)和均方误差(MSE)两个方面进行实验,并分别就同一种滤波算法,不同的信号以及同一个信号,不同的滤波算法的滤波情况进行对比分析。最后通过结合上述分析给出小波滤波的研究热点、难点、不足和有待解决的一些问题。    

15.  两种聚类算法在顾客行为分析中的应用比较  
     《计算机应用研究》,2012年第29卷第11期
   分析网络群落划分的GN聚类和模式识别中AP聚类两种算法的设计思想和特点;以图书借阅记录为例构建了顾客聚类的数据集,进行了两种算法的聚类比较。研究表明,两种算法从不同角度揭示了顾客群体的结构特征,GN聚类结果与顾客的宏观特征分类相接近,而AP算法结果反映出顾客需求的分布特征。探讨了算法设计原则对实验结果产生的影响。这些工作可为聚类算法的设计改进和顾客行为的数据挖掘等研究提供一定的参考。    

16.  分布式环境中聚类问题算法研究综述  被引次数:1
       张书云  马燕林《计算机应用研究》,2013年第30卷第9期
   传统的集中式聚类是对集中存放在单个站点的数据集进行聚类,但不能解决数据分布存储环境下的聚类问题,而分布式聚类算法是从分布存储的数据集中提取分类模式,因此能满足此需求。针对分布式聚类算法进行综述和分析。首先对现有的分布式聚类算法进行了分类,然后对每类算法的基本思想和优缺点进行了比较,最后采用Iris和Wine两个数据集对几种分布式聚类算法从聚类精度和聚类时间两方面进行了比较。    

17.  聚类分析的并行化实现技术研究  
   齐浩  马力《电子设计工程》,2015年第2期
   文中基于使传统聚类算法能够满足当前大数据分析的对计算效率的需求,采用将传统聚类算法分布式化的方法提高传统聚类算法效率。结合近年来广泛使用的Map Reduce分布式处理模型,对K-means、PAM、CLARA 3种算法进行了分布式化实验,并从数据规模和节点数量两个方面考察、讨论了一些影响并行算法性能的因素。实验分析表明,该方法能够有效地将聚类方法并行化,并可以应用在分布式系统当中。    

18.  聚类趋势问题的研究综述*  被引次数:1
   褚娜  马利庄  王彦《计算机应用研究》,2009年第26卷第3期
   聚类算法的性能与数据集的结构是密切相关的,虽然目前已经研究出了很多聚类算法,但没有普遍适用的万能聚类算法,欠缺对数据集结构的有效解释。对聚类分析过程中重要的关键性问题,即聚类趋势问题进行了系统性的研究,从统计检验、可视化分析等角度给予了讨论,为数据集的无监督聚类分析提供了合理和有效的前期分析工具。    

19.  数据挖掘中聚类算法研究进展  被引次数:4
   周涛  陆惠玲《计算机工程与应用》,2012年第48卷第12期
   聚类分析是数据挖掘中重要的研究内容之一,对聚类准则进行了总结,对五类传统的聚类算法的研究现状和进展进行了较为全面的总结,就一些新的聚类算法进行了梳理,根据样本归属关系、样本数据预处理、样本的相似性度量、样本的更新策略、样本的高维性和与其他学科的融合等六个方面对聚类中近20多个新算法,如粒度聚类、不确定聚类、量子聚类、核聚类、谱聚类、聚类集成、概念聚类、球壳聚类、仿射聚类、数据流聚类等,分别进行了详细的概括。这对聚类是一个很好的总结,对聚类的发展具有积极意义。    

20.  一种基于MPI的稀疏化局部尺度并行谱聚类算法的研究与实现  
   李瑞琳  赵永华  黄小磊《计算机工程与科学》,2016年第38卷第5期
   谱聚类算法由于其可识别非凸数据分布、可有效避免局部最优解、不受数据点维数限制等优点,在许多领域得到广泛应用。然而,随着数据量的增大和数据维数的增多,在保证聚类准确性的前提下,尽可能降低计算时间将变得非常必要。此外,影响谱聚类算法聚类质量的因素除数据集本身外,还与所采用的求解距离矩阵的方法、相似性矩阵的尺度参数、Laplacian矩阵形式等多种因素相关。针对以上问题,首先对于大规模数据问题,将MPI并行编程模型应用于谱聚类算法;然后利用t 最近邻方法对谱聚类算法中较大维数的Laplacian矩阵进行近似转化,同时用局部尺度(Local Scaling)参数对算法中的尺度参数进行自动调节。基于上述分析,提出了一种谱聚类并行实现算法,即稀疏化局部尺度并行谱聚类算法SLSPSC,并在四个数据集上进行了测试,与现有的并行谱聚类算法PSC在运行时间和聚类质量两方面做了比较分析。实验结果显示,该算法降低了求解Laplacian矩阵的总时间,同时部分数据集聚类质量得到较大提高。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号