期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

面向非球形分布数据的自适应K近邻聚类算法 总被引：2，自引：0，他引：2

黄晓斌万建伟张燕《计算机工程》2003,29(11):21-22,165

针对传统聚类算法处理非球形分布数据的不足，提出了一种新型的自适应K近邻聚类算法。该算法由数据集归一化、初始类别构造和初始类别融合3个步骤构成。仿真结果表明，该算法在无须聚类数目的前提下，对非球型分布数据具有很好的聚类效果。相似文献

2.

张燕贾焰黄晓斌《计算机研究与发展》2008,45(Z1):250-254

针对传统聚类算法处理复杂分布数据的不足,提出了一种新型的基于旋转超盒和引力场融合的聚类算法.该算法由1)数据集归一化;2)利用旋转超盒构造初始类别;3)借助引力场概念对初始类别进行融合3个步骤构成.仿真结果表明,该算法在无需聚类数目的情况下,对复杂分布数据具有很好的聚类效果. 相似文献

3.

一种改进的自适应K近邻聚类算法

黄晓斌万建伟张燕《计算机工程与应用》2004,40(15):76-78,130

为解决传统聚类算法不能处理非球形分布数据的问题,文犤5犦提出了一种自适应k近邻聚类算法。该算法在无需聚类数目的前提下,能有效解决非球形分布数据的聚类问题。但进一步的研究表明,该算法在处理带“奇异”样本的数据集时失去效果。为此,该文给出了一种改进的自适应k近邻聚类算法。仿真结果表明,新算法不仅保持了原算法在处理非球形分布数据时的优良特性,还成功解决了“奇异”样本问题。相似文献

4.

一种基于类别融合的模糊最小最大聚类算法 总被引：1，自引：1，他引：1

黄晓斌马晓岩陈松秦江敏《计算机工程与设计》2002,23(11):78-81,85

提出了一种新型的基于类别融合的模糊最小最大聚类算法，该算法首先使用初始类别生成子算法对归一化后的数据集进行预处理，从而生成一系列初始模式类别；然后利用类别融合于算法，将类别融合问题转化为求一无向图的连通子图问题，从而得出在同一连通子图中的点融合为同一类，连接子图的数目为最终的聚类数目。仿真结果表明，在处理未知模式类别数目且数据样本任意分布的数据集时，该算法明显优于传统的模糊C均值算法。相似文献

5.

基于簇间相似度判定的自适应K均值算法

陈杰朱娟《计算机工程与设计》2010,31(10)

针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺陷,定义了簇间相似度度量对传统K-均值聚类进行改进.新算法可以在事先不确定K值的情况下,根据欧氏距离选取初始质心并按照K均值算法聚类,然后过滤噪声样本并确定簇半径,计算簇间相似度并合并相似簇确定数据集的类别数并得到较优的聚类结果.通过在UCI数据集的实验结果表明,新算法能准确确定类别数并有高于传统K均值算法聚类精度. 相似文献

6.

基于样本空间分布密度的初始聚类中心优化K-均值算法* 总被引：2，自引：1，他引：1

谢娟英郭文娟谢维信高新波《计算机应用研究》2012,29(3):888-892

针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。相似文献

7.

复杂分布数据的二阶段聚类算法 总被引：4，自引：0，他引：4

公茂果王爽马萌曹宇焦李成马文萍《软件学报》2011,22(11):2760-2772

提出了一种用于复杂分布数据的二阶段聚类算法(two-phase clustering,简称TPC),TPC包含两个阶段:首先将数据划分为若干个球形分布的子类,每一个子类用其聚类中心代表该类内的所有样本;然后利用可以处理复杂分布数据的流形进化聚类(manifold evolutionary clustering,简称MEC)对第1阶段得到的聚类中心进行类别划分;最后综合两次聚类结果整理得到最终聚类结果.该算法基于改进的K-均值算法和MEC算法.在进化聚类算法的基础上引入流形距离,使得算法能够胜任复杂分布的数据聚类问题.同时,算法降低了引入流形距离所带来的计算量.在分布各异的7个人工数据集和7个UCI数据集测试了二阶段聚类算法,并将其效果与遗传聚类算法、K均值算法和流形进化聚类算法做了比较.实验结果表明,无论对于简单或复杂、凸或非凸的数据,TPC都表现出良好的聚类性能,并且计算时间与MEC相比明显减少. 相似文献

8.

基于K近邻的模糊密度峰值聚类算法研究

《软件》2017,(4):85-90

基于密度的聚类算法(Density Peak Clustering,DPC)广泛使用在处理非球形数据集的聚类问题,算法使用较少的参数就能够实现数据集的处理。但该算法存在这样一些的不足:首先,全局变量的设定没有考虑数据的局部结构,特别是当不同类别的局部密度差别很大的情况下,容易忽略一些密度较小的类别,聚类效果不理想。其次,DPC提出了一种通过决策图来人工选取聚类中心点的方法,这也是DPC算法在人工智能数据分析的一个重大缺陷。为此,本文提出了基于K近邻的模糊密度峰值聚类算法,算法针对这两方面的不足进行了改进。最后本文使用人工数据集和UCI数据集进行了实验,实验结果表明本文所提出的算法,在不通过人工选取聚类中心的情况下,能够正确地找出类别个数,并且保持着较高的聚类精确度,验证了算法的有效性。相似文献

9.

FCM算法用于灰度图像分割的初始化方法的研究 总被引：1，自引：1，他引：1

匡泰朱清新孙跃《计算机应用》2006,26(4):784-786

模糊C均值聚类(FCM)算法是一种经典的模糊聚类分析方法，但其算法初始聚类中心集是随机选取的，从而造成算法的性能强烈的依赖聚类中心集的初始化。提出了一种改进的基于多项式求解的FCM(PFCM)算法，该算法基于求解多项式的根来确定数据集初始聚类中心集，很好地解决了数据初始聚类中心集问题，使数据初始聚类中心集代表了数据集类别的特征，在此基础上，采用FCM算法得到聚类中心集的近似最优解。相似文献

10.

基于RFM模型的半监督聚类算法

程汝娇徐鸿雁《计算机系统应用》2017,26(11):170-175

客户分类作为客户关系管理（CRM）的重要管理方法,是企业进行市场营销的重要依据.通过对客户进行分类,有利于对客户价值进行准确评估,方便进行精准营销.本文通过对RFM模型数据集本身潜藏的先验结构化信息进行研究,标记出两组客户数据作为先验类别标记,进而得到两个初始聚类中心.基于传统K-means算法使用自适应方法确定K值和初始聚类中心.引入Must-link和Cannot-link两种约束将类别标记转换为成对约束信息,基于HMRF-KMeans成对约束,引入约束惩罚项和约束奖励项,实现对聚类引导和聚类结果的调整.使用改进的半监督聚类算法（RFM-SS-means）对标准数据集进行了测试,同时使用Food mart数据集对比了RFM-SS-means算法与传统K-means算法、two-steps算法的聚类效果.由实验结果可知,RFM-SS-means的CH系数最大,无需事先确定K值和初始聚类中心,聚类效果良好. 相似文献