期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘凤芹《计算机光盘软件与应用》2012,(21):60-61

聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。相似文献

2.

数据挖掘中聚类算法研究

周妍孔晓玲张然《福建电脑》2007,(8):9-10,21

聚类分析是数据挖掘的核心技术之一。本文介绍了当前最具代表性的聚类算法,分析它们各方面的特性,总结了聚类方法发展的趋势,并对聚类算法的研究提出了展望,便于研究者对已有算法应用与改进。相似文献

3.

覆盖聚类算法的应用研究

朱永红《微机发展》2007,17(1):123-124

聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法———覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。相似文献

4.

覆盖聚类算法的应用研究

朱永红《计算机技术与发展》2007,17(1):123-125

聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法，给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法，给出了该算法的具体步骤，并对模糊聚类算法和该算法用实验的方式进行比较，证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。相似文献

5.

基于层次聚类和划分聚类算法的BTS聚类算法研究

刘康明艾鸽张宇傅毓《网络安全技术与应用》2022,(5):45-46

BTS(Best Two Step)聚类算法是结合层次聚类和划分聚类算法的两步聚类算法。层次聚类算法类与类之间不可以对象交换,很容易造成聚类质量不高的结果。而划分聚类对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的聚类效果。相似文献

6.

数据挖掘中聚类算法比较研究 总被引：16，自引：0，他引：16

张红云刘向东段晓东苗夺谦马垣《计算机应用与软件》2003,20(2):5-6,77

聚类算法是数据挖掘的核心技术，本文结合提出了评价聚类算法好坏的5个标准，基于这5个标准，对数据挖掘中常用聚类算法作了比较分析，以便于人们更容易，更快捷地找到一种适用于特定问题的聚类算法。相似文献

7.

谱聚类算法研究综述

白璐赵鑫孔钰婷张正航邵金鑫钱育蓉《计算机工程与应用》2021,57(14):15-26

聚类分析是一种常见的分析方法,谱聚类作为聚类分析的一支,因其不受样本形状约束等特点备受瞩目.为及时掌握当前谱聚类算法研究动态,通过对比分析众多谱聚类优化算法,从半监督学习、二阶段聚类算法选择、算法执行效率优化等三个角度,将谱聚类优化算法分为三类,并对每类算法的优化思想进行综述.介绍经典多路谱聚类与基本理论,并分析相似矩... 相似文献

8.

基于聚类特性的大规模文本聚类算法研究 总被引：3，自引：0，他引：3

唐春生金以慧《计算机科学》2002,29(9):13-15

一、引言随着Internet的飞速发展,人们能从网上得到更多的信息,但过多的信息常常会导致信息迷失。将信息进行分类是帮助信息利用的有效方法,聚类则是文本类别划分时常用的技术,其特点是不需训练集即可从给定的文本集合中找到聚类划分。已有的聚类方法大多是针对小规模数据的,当计算资源和时间受到限制时,原有的大部分方法已不能满足要求,需要能够处理大规模数据的算法。标准k均值方法是比较基本也是很常用的一种聚类方法,其计算复杂度与模式数量成线性关系,这使其具有处理大规模数据的可能。k均值方法本质上是一种选代的方法,当数据不能一次全部读入内存时,则需和磁盘进行多次数据交换,并且这种交换相应于迭代次数要反复多次,这无疑需要花费大量的I/O时间。相似文献

9.

增量式CURE聚类算法研究 总被引：3，自引：0，他引：3

冯兴杰黄亚楼《小型微型计算机系统》2004,25(10):1847-1849

聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的更新 .由于数据量大 ,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效 ,因此亟待研究增量式聚类算法 .通过对 CURE聚类算法的改进 ,提出了一种高效的增量式 CU RE聚类算法 .它能够很好的解决传统聚类算法在伸缩性、数据定期更新时所面临的问题 .实验结果显示本算法是一种有效的增量式聚类算法相似文献

10.

数据挖掘中聚类算法比较研究

魏丽《数字社区&智能家居》2007,(11):637-639

聚类分析技术是数据挖据中的一种重要技术。本文介绍了数据挖掘对聚类的典型要求和聚类方法的分类，研究分析了聚类的主要算法．并从多个方面对这些算法的性能进行比较。相似文献

11.

K-means算法的初始点优化研究

MOU Ying QUAN Tai-feng 《数字社区&智能家居》2008,(32)

为了克服经典K-means算法对初始聚类中心过分依赖的缺点,该文提出采用竞争神经网络和密度思想对经典k-means算法进行预处理,从而改变经典K-means算法对初始聚类中心的随机选择。实验结果表明,这两种方法是有效的。相似文献

12.

对K-means及势函数聚类算法的研究与改进

下载免费PDF全文

叶于林夏秀渝莫建华刘帅《计算机系统应用》2015,24(4):209-213

在目前聚类方法中, k-means与势函数是最常用的算法,虽然两种算法有很多优点,但也存在自身的局限性。 k-means聚类算法：其聚类数目无法确定,需要提前进行预估,同时对初始聚类中心敏感,且容易受到异常点干扰;势函数聚类算法：其聚类区间范围有限,对多维数据进行聚类其效率低。针对以上两种算法的缺点,提出了一种基于 K-means 与势函数法的改进聚类算法。它首先采用势函数法确定聚类数目与初始中心,然后利用K-means法进行聚类,该改进算法具有势函数法“盲”特性及K-means法高效性的优点。实验对改进算法的有效性进行了验证,结果表明,改进算法在聚类精度及收敛速度方面有很大提高。相似文献

13.

基于遗传算法的硬聚类算法改进

赵建民管国权王红艳《计算机工程与科学》2008,30(8):83-85

硬聚类算法HCM求解的结果通常都是局部的最优解,当模糊集合间的运算采用传统定义的时候,它的聚类结果中还会存在无意义的聚类集。本文通过研究表明,在HCM聚类算法中应用遗传算法,可以在一定程度上避免硬聚类算法收敛到局部最优解。因此,本文将遗传算法应用于硬聚类算法,并设计了相应的算法。但是,考虑到本算法实现时的开销销和效率,又对该算法进行了改进,并最终提出一种新的算法--CHCM聚类算法。测试数据表明,采用改进后的聚类算法的结果90％以上能够取得全局的最优解,远远超过了采用硬聚类算法时所取得全局最优解的次数,证明了本算法的可推广性。相似文献

14.

一种新型的基于密度和栅格的聚类算法* 总被引：2，自引：1，他引：1

熊仕勇《计算机应用研究》2011,28(5):1721-1723

针对网格和密度方法的聚类算法存在效率和质量问题,给出了密度和栅格相结合的聚类挖掘算法,即基于密度和栅格的聚类算法DGCA（density and grid based clustering algorithm）。该算法首先将数据空间划分为栅格单元,然后把数据存储到栅格单元中,利用DBSCAN密度聚类算法进行聚类挖掘;最后进行聚类合并和噪声点消除,并将局部聚类结果映射到全局聚类结果。实验通过人工数据样本集对该聚类算法进行理论上验证,表明了该算法在时间效率和聚类质量两方面都得到了提高。相似文献

15.

基于聚类分析算法的智能旅游规划

聂雷刚李咏梅余元辉《电脑开发与应用》2012,25(2):28-30

为了解决游客选取旅游景点以及最短旅行线路时的困惑,将智能导游引入到旅游规划中,在地图软件的基础上插入厦门的旅游景点数据进行二次开发。首先以层次聚类算法分解出游客喜好的景点集合类簇,再以改进的密度法在不同地区有针对性地以不同的搜索半径搜索附近满足要求的景点,为游客提供一个最优的旅游规划。相似文献

16.

文档聚类中k-means算法的一种改进算法 总被引：14，自引：0，他引：14

万小军杨建武陈晓鸥《计算机工程》2003,29(2):102-103,157

介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理,但它对孤立点很敏感,为此,文章提出将聚类均值点与聚类种子相分离的思想,并具体给出了基于该思想的对k-means算法的改进算法,实验表明,该改进算法比原k-means算法具有更高的准确性和稳定性。相似文献

17.

优化初始聚类中心的K-means聚类算法 总被引：1，自引：0，他引：1

郭永坤章新友刘莉萍丁亮牛晓录《计算机工程与应用》2020,56(15):172-178

针对传统K-means算法对初始中心十分敏感,聚类结果不稳定问题,提出了一种改进K-means聚类算法。该算法首先计算样本间的距离,根据样本距离找出距离最近的两点形成集合,根据点与集合的计算公式找出其他所有离集合最近的点,直到集合内数据数目大于或等于[α]（[α]为样本集数据点数目与聚类的簇类数目的比值）,再把该集合从样本集中删除,重复以上步骤得到K（K为簇类数目）个集合,计算每个集合的均值作为初始中心,并根据K-means算法得到最终的聚类结果。在Wine、Hayes-Roth、Iris、Tae、Heart-stalog、Ionosphere、Haberman数据集中,改进算法比传统K-means、K-means++算法的聚类结果更稳定;在Wine、Iris、Tae数据集中,比最小方差优化初始聚类中心的K-means算法聚类准确率更高,且在7组数据集中改进算法得到的轮廓系数和F1值最大。对于密度差异较大数据集,聚类结果比传统K-means、K-means++算法更稳定,更准确,且比最小方差优化初始聚类中心的K-means算法更高效。相似文献

18.

自适应数据库中基于特征向量的聚类算法的研究与改进

高燕飞陈俊杰强彦《电脑开发与应用》2008,21(7):57-58

在负载自适应数据库系统中,负载特征化部件是关键部分,首先要对负载分类,然后根据分类的情况预测负载性能。负载的分类一般采用聚类算法,聚类算法中比较典型的就是K—means算法。但在K—means算法中,k值必须提前设定而且不能根据负载的实际情况改变,就是对算法的一个改进,使得k值动态的、能够根据负载的实际情况改变。实验结果表明,使用该算法的分类结果预测负载运行时间的准确性有明显提高。相似文献

19.

基于图信息的自监督多视角子空间聚类

下载免费PDF全文

吴峰刘改刘诗仪《计算机系统应用》2022,31(5):377-381

多视角子空间聚类方法通常用于处理高维度、复杂结构的数据.现有的大多数多视角子空间聚类方法通过挖掘潜在图信息进行数据分析与处理,但缺乏对潜在子空间表示的监督过程.针对这一问题,本文提出一种新的多视角子空间聚类方法,即基于图信息的自监督多视角子空间聚类(SMSC).它将谱聚类与子空间表示相结合形成统一的深度学习框架.SMS... 相似文献