期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘康明艾鸽张宇傅毓《网络安全技术与应用》2022,(5):45-46

BTS(Best Two Step)聚类算法是结合层次聚类和划分聚类算法的两步聚类算法。层次聚类算法类与类之间不可以对象交换,很容易造成聚类质量不高的结果。而划分聚类对于初始值的设定以及异常噪声数据都很敏感,所以我们研究提出了BTS算法,实验证明BTS算法可达到高质量的聚类效果。相似文献

2.

基于层次划分的密度优化聚类算法

逄琳刘方爱《计算机应用》2016,36(6):1634-1638

针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD)。该算法基于层次划分,对计算过程进行研究,不需要对数据集进行反复聚类。首先,扫描数据集获得所有聚类特征的统计值;其次,自底向上地生成不同层次的数据划分,计算每个划分数据点的密度,将最大密度点定为中心点,计算中心点距离更高密度点的最小距离,以中心点密度与最小距离乘积之和的平均值为有效性指标,增量地构建一条关于不同层次划分的聚类质量曲线;最后,根据曲线的极值点对应的划分估计最佳聚类数和初始聚类中心。实验结果表明,所提CODHD算法与预处理阶段的聚类优化(COPS)算法相比,聚类准确度提高了30%,聚类算法效率至少提高14.24%。所提算法具有较强的可行性和实用性。相似文献

3.

基于划分的蚁群聚类算法研究

《信息与电脑》2019,(2)

聚类分析是一种重要的人类活动,被广泛应用于数据挖掘、统计学、生物学和机器学习等领域。随着仿生学的发展,一种新的智能优化算法——蚁群算法被提出,并被应用于聚类分析。针对PAM算法和蚁群聚类算法的缺点,提出了一种将PAM算法和蚁群聚类算法相结合的聚类方法。仿真实验表明,算法性能得到了有效提高。相似文献

4.

一种新的基于图划分聚类算法---GAGPBCUK算法

李小红罗敏《计算机科学》2012,39(9):162-165

提出了一种新的基于图划分的聚类算法——GAGPBCUK算法。该算法解决了谱聚类算法参数敏感和聚类结果不准确等问题。3组仿真实验结果表明,GAGPBCUK算法不仅在识别和学习数据集中的隐含聚类数方面具有很好的性能,而且能够得到比谱聚类算法(NJW算法)更加有效的聚类结果。相似文献

5.

聚类算法研究

刘凤芹《计算机光盘软件与应用》2012,(21):60-61

聚类分析在数据挖掘领域中是一个非常重要的研究课题,该文阐述了聚类算法的基本原理和性能要求,并依据算法思想的不同把聚类算法分为五类,详细介绍了每一类的算法思想、优缺点及典型算法,有利于用户对聚类算法的选择和研究者对聚类算法的改进研究,最后探讨了聚类算法今后的发展趋势。相似文献

6.

新的小生境萤火虫划分聚类算法

王冲雷秀娟《计算机工程》2014,(5):173-177

针对传统的划分聚类算法过度依赖初始聚类中心并容易陷入局部最优的问题,提出基于萤火虫算法的改进划分聚类算法。该算法将萤火虫个体对应于一组聚类中心的解,类簇的聚合度对应于萤火虫的亮度,通过萤火虫个体之间的相互吸引寻找聚类中心的最优解。在寻优过程中使用随机分布的萤火虫种群克服划分聚类过于依赖初始聚类中心的问题,采用自适应步长的策略加强算法寻找精确解的能力。为了避免在寻优过程中因为种群过于集中而导致算法陷入局部最优,引入小生境技术提高萤火虫的种群多样性。仿真实验结果表明,与传统聚类算法相比,该算法的聚类精度较高,稳定性较好。相似文献

7.

覆盖聚类算法的应用研究

朱永红《计算机技术与发展》2007,17(1):123-125

聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法，给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法——覆盖聚类算法，给出了该算法的具体步骤，并对模糊聚类算法和该算法用实验的方式进行比较，证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。相似文献

8.

覆盖聚类算法的应用研究

朱永红《微机发展》2007,17(1):123-124

聚类算法是数据挖掘的核心技术。介绍了几类主要的传统聚类算法,给出了每类算法的基本概念、基本原理、各类表示聚类的算法以及这些算法的特征。然后再提出了一种新的聚类算法———覆盖聚类算法,给出了该算法的具体步骤,并对模糊聚类算法和该算法用实验的方式进行比较,证明了覆盖聚类算法的可行性和有效性。最后分析了当前聚类算法存在的问题和发展方向。相似文献

9.

数据挖掘中聚类算法研究

周妍孔晓玲张然《福建电脑》2007,(8):9-10,21

聚类分析是数据挖掘的核心技术之一。本文介绍了当前最具代表性的聚类算法,分析它们各方面的特性,总结了聚类方法发展的趋势,并对聚类算法的研究提出了展望,便于研究者对已有算法应用与改进。相似文献

10.

优化初始聚类中心的K-means聚类算法 总被引：1，自引：0，他引：1

下载免费PDF全文

郭永坤章新友刘莉萍丁亮牛晓录《计算机工程与应用》2020,56(15):172-178

针对传统K-means算法对初始中心十分敏感,聚类结果不稳定问题,提出了一种改进K-means聚类算法。该算法首先计算样本间的距离,根据样本距离找出距离最近的两点形成集合,根据点与集合的计算公式找出其他所有离集合最近的点,直到集合内数据数目大于或等于[α]（[α]为样本集数据点数目与聚类的簇类数目的比值）,再把该集合从样本集中删除,重复以上步骤得到K（K为簇类数目）个集合,计算每个集合的均值作为初始中心,并根据K-means算法得到最终的聚类结果。在Wine、Hayes-Roth、Iris、Tae、Heart-stalog、Ionosphere、Haberman数据集中,改进算法比传统K-means、K-means++算法的聚类结果更稳定;在Wine、Iris、Tae数据集中,比最小方差优化初始聚类中心的K-means算法聚类准确率更高,且在7组数据集中改进算法得到的轮廓系数和F1值最大。对于密度差异较大数据集,聚类结果比传统K-means、K-means++算法更稳定,更准确,且比最小方差优化初始聚类中心的K-means算法更高效。相似文献

11.

一种基于语料特性的聚类算法 总被引：3，自引：0，他引：3

曾依灵许洪波吴高巍白硕《软件学报》2010,21(11):2802-2813

为寻求模型不匹配问题的一种恰当的解决途径,提出了基于语料分布特性的CADIC(clustering algorithm based on the distributions of intrinsic clusters)聚类算法。CADIC以重标度的形式隐式地将语料特性融入算法框架,从而使算法模型具备更灵活的适应能力。在聚类过程中,CADIC选择一组具有良好区分度的方向构建CADIC坐标系,在该坐标系下统计固有簇的分布特性,以构造各个坐标轴的重标度函数,并以重标度的形式对语料分布进行隐式的归一化,从而提高聚相似文献

12.

对k-means聚类算法的改进 总被引：17，自引：6，他引：17

袁方孟增辉于戈《计算机工程与应用》2004,40(36):177-178,232

提出了一种k-means聚类算法中寻找初始聚类中心的新方法。算法首先计算样本间的距离,然后根据样本点之间的距离寻找有可能是一类的数据,依据这些样本点形成初始聚类中心,从而得到较好的聚类结果。实验表明,改进后的方法相对于随机选取初始聚类中心具有较高的准确率。相似文献

13.

结合蚁群聚类算法的模糊C均值聚类

周峰李龙澍《微机发展》2012,(7):45-48

模糊C均值（FCM）聚类算法采取随机选取聚类中心的方法,这种方法使得FCM算法在局部范围内容易获得最优解,但在全局范围内效果较差,且FCM算法中聚类簇的个数一般需要人为设定。面对上述种种问题,文中将蚁群聚类算法和FCM聚类算法进行结合,获得了一种改进的FCM聚类算法。该算法在初步聚类中利用蚁群聚类产生聚类中心和簇的个数,将产生的聚类中心提供给FCM算法进行再次聚类。利用蚁群聚类的全局搜索和并行运算的优点避免了聚类易陷入局部最优解的缺陷。经过实验验证,该算法较一般FCM算法具有更好的性能。相似文献

14.

基于MATLAB的模糊聚类分析的传递方法 总被引：5，自引：1，他引：5

唐庭安陈新陈新度《微计算机应用》2004,25(6):739-741

聚类分析中的传递方法是直接通过模糊相似矩阵获得动态聚类图，该方法比通过传递闭包法求模糊等价矩阵而获得动态聚类图的方法在时间复杂度和空间复杂度要小，本文对重点介绍传递方法，并给出了由MATLAB语言实现的算法程序，并介绍了一个应用实例。相似文献

15.

一种量子聚类的改进算法

下载免费PDF全文

李志华王士同《计算机工程》2007,33(23):189-190

介绍了量子势能、量子力学中粒子的分布机制和量子聚类算法,给出了量子聚类QC算法的物理理论根据,指出了量子聚类算法的优点和不足,提出了一种基于度量距离改变的量子聚类算法DQC,该算法对IRIS样本的聚类准确率比QC算法高出了8个百分点,实验结果证明了该算法的有效性。相似文献

16.

基于k均值分区的流数据高效密度聚类算法 总被引：2，自引：0，他引：2

倪巍伟陆介平陈耿孙志挥《小型微型计算机系统》2007,28(1):83-87

数据流聚类是数据流挖掘研究的一个重要内容,已有的数据流聚类算法大多采用k中心点(均值)方法对数据进行聚类,不能对数据分布不规则以及高维空间数据流进行有效聚类.论文提出一种基于k均值分区的流数据密度聚类算法,先对数据流进行分区做k均值聚类生成中间聚类结果(均值参考点集),随后对这些均值参考点进行密度聚类,理论分析和实验结果表明算法可以有效解决数据分布不规则以及高维空间数据流聚类问题,算法是有效可行的. 相似文献

17.

文档聚类中k-means算法的一种改进算法 总被引：14，自引：0，他引：14

万小军杨建武陈晓鸥《计算机工程》2003,29(2):102-103,157

介绍了文档聚类中基于划分的k-means算法,k-means算法适合于海量文档集的处理，但它对孤立点很敏感，为此，文章提出将聚类均值点与聚类种子相分离的思想，并具体给出了基于该思想的对k-means算法的改进算法，实验表明，该改进算法比原k-means算法具有更高的准确性和稳定性。相似文献

18.

基于k最相似聚类的子空间聚类算法 总被引：1，自引：2，他引：1

下载免费PDF全文

单世民闫妍张宪超《计算机工程》2009,35(14):4-6

子空间聚类是聚类研究领域的一个重要分支和研究热点,用于解决高维聚类分析面临的数据稀疏问题。提出一种基于k最相似聚类的子空间聚类算法。该算法使用一种聚类间相似度度量方法保留k最相似聚类,在不同子空间上采用不同局部密度阈值,通过k最相似聚类确定子空间搜索方向。将处理的数据类型扩展到连续型和分类型,可以有效处理高维数据聚类问题。实验结果证明,与CLIQUE和SUBCLU相比,该算法具有更好的聚类效果。相似文献