期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

软硬结合的快速模糊C-均值聚类算法的研究 总被引：2，自引：1，他引：1

尹海丽王颖洁白凤波《计算机工程与应用》2008,44(22):172-174

讨论的是对模糊C-均值聚类方法的改进,在原有的模糊C-均值算法的基础上,提出一种软硬结合的快速模糊C-均值聚类算法。快速模糊C-均值聚类算法是在模糊C-均值聚类算法之前加入一层硬C-均值聚类算法。硬聚类算法能比模糊聚类算法以高得多的速度完成,将硬聚类中心作为模糊聚类中心的迭代初值,从而提高模糊C-均值聚类算法的收敛速度,这对于大量数据的聚类是很有意义的。用数据仿真验证了这种快速模糊C-均值聚类算法比模糊C-均值算法迭代调整过程短,收敛速度快,聚类效果好。相似文献

2.

聚类问题的自适应杂交差分演化模拟退火算法 总被引：1，自引：0，他引：1

下载免费PDF全文

苏清华胡中波熊一能《计算机工程与应用》2010,46(23):41-43

针对K-均值聚类算法对初始值敏感和易陷入局部最优的缺点,提出了一个基于自适应杂交差分演化模拟退火的K-均值聚类算法。该算法以差分演化算法为基础,通过模拟退火算法的更新策略来增强全局搜索能力,并运用自适应技术来选择学习策略、确定算法的关键参数。实验结果表明,该算法能较好地克服传统K-均值聚类算法的缺点,具有较好的全局收敛能力,且算法稳定性强、收敛速度快,将新算法与传统的K-均值聚类算法以及最近提出的几个同类聚类算法进行了比较。相似文献

3.

基于初始中心优化的遗传K-means聚类新算法 总被引：2，自引：2，他引：0

孙秀娟刘希玉《计算机工程与应用》2008,44(23):166-168

一个好的K-means聚类算法至少要满足两个要求：（1）能反映聚类的有效性,即所分类别数要与实际问题相符;（2）具有处理噪声数据的能力。传统的K-means算法是一种局部搜索算法,存在着对初始化敏感和容易陷入局部极值的缺点。针对此缺点,提出了一种优化初始中心的K-means算法,该算法选择相距最远的处于高密度区域的k个数据对象作为初始聚类中心。实验表明该算法不仅具有对初始数据的弱依赖性,而且具有收敛快,聚类质量高的特点。为体现聚类的有效性,获得更高精度的聚类结果,提出了将优化的K-means算法（PKM）和遗传算法相结合的混合算法（PGKM）,该算法在提高紧凑度（类内距）和分离度（类间距）的同时自动搜索最佳聚类数k,对k个初始中心优化后再聚类,不断地循环迭代,得到满足终止条件的最优聚类。实验证明该算法具有更好的聚类质量和综合性能。相似文献

4.

一种混合均值聚类算法的实现

下载免费PDF全文

陈寿文李明东《计算机工程与应用》2010,46(18):132-134

从K-Means聚类算法和FCM算法混合运行的角度来探讨聚类问题,针对FCM算法初始化隶属度矩阵的随机性问题,提出了一种混合均值聚类算法。在混合算法运行过程中,利用前者的聚类结果信息来初始化后者的初始中心,依此来计算FCM算法初始隶属度矩阵,通过FCM算法的运行,最终实现数据集的聚类目的。实验结果表明该混合均值算法比单纯使用FCM算法效果好。相似文献

5.

基于ART2改进算法的故障聚类研究 总被引：1，自引：1，他引：0

段霞霞刘彦明李小平杨一展《计算机工程与应用》2008,44(15):56-57

ART2（自适应谐振理论2）算法是神经网络中一种可以对模拟输入信号或二值信号进行无监督聚类的算法,所以ART2算法能够降低数据挖掘中原始数据的预处理的复杂度,提高挖掘效率。针对ART2算法中出现的聚类中心偏移的缺点,采用ART2算法与K-均值算法相结合的方法来抑制ART2中聚类中心偏移的现象。通过仿真对该方法进行了验证。相似文献

6.

K-means算法初始聚类中心选择的优化

冯波郝文宁陈刚占栋辉《计算机工程与应用》2013,49(14):182-185

针对传统K-means算法对初始聚类中心敏感的问题,提出了基于数据样本分布情况的动态选取初始聚类中心的改进K-means算法。该算法根据数据点的距离构造最小生成树,并对最小生成树进行剪枝得到K个初始数据集合,得到初始的聚类中心。由此得到的初始聚类中心非常地接近迭代聚类算法收敛的聚类中心。理论分析与实验表明,改进的K-means算法能改善算法的聚类性能,减少聚类的迭代次数,提高效率,并能得到稳定的聚类结果,取得较高的分类准确率。相似文献

7.

基于Bagging的XML文档集成聚类研究

下载免费PDF全文

赵斌张永胜《计算机工程与应用》2009,45(14):138-140

将集成学习方法应用到XML文档聚类中来改进传统聚类算法的不足。提出一种标签与路径相结合的XML文档向量模型,基于这个模型,首先对原始文档集进行多次抽样,在新文档集上进行K均值聚类,然后对得到的聚类中心集合进行层次聚类。在人工数据集和真实数据集上的实验表明,该算法在召回率和精确率上优于K均值算法,并且增强了其鲁棒性。相似文献

8.

初始聚类中心优化选取的核C-均值聚类算法 总被引：4，自引：1，他引：3

单凯晶肖怀铁《计算机仿真》2009,26(7):118-121

在通常的核C-均值聚类算法中,聚类结果对初始聚类中心敏感,随机选取初始聚类中心时,会使得迭代次数较多、分类结果不稳定.针对该问题提出一种优化选取仞始聚类中心的算法.该方法采用一种改进的最大最小距离算法对原始空间中的数据进行粗分类,将粗分类结果中每类类心作为初始聚类中心,再运用核C-均值聚类算法进行分类.仿真实验结果表明方法能有效减少迭代次数,使分类结果更加稳定,分类识别率也有一定程度的提高. 相似文献

9.

基于密度的K-Means算法及在客户细分中的应用研究 总被引：4，自引：1，他引：3

下载免费PDF全文

向坚持刘相滨资武成《计算机工程与应用》2008,44(35):246-248

针对K-Means算法所存在的问题进行了深入研究,提出了基于密度的K-Means算法（KMAD算法）。该算法采用聚类对象区域空间的密度分布方法来确定聚类个数K的值,然后用高密度区域的质心作为K-Means算法的初始聚类中心。理论分析与实验结果表明了改进算法的有效性和稳定性,并将改进的算法应用于客户细分研究中。相似文献

10.

改进的k-nn快速分类算法 总被引：1，自引：0，他引：1

下载免费PDF全文

桑应宾刘琼荪《计算机工程与应用》2009,45(11):145-146

针对传统的k-近邻（k-nn）方法的缺点,将聚类中的K均值和分类中的k近邻算法有机结合,提出了一种改进的k-nn快速分类算法。实验表明该算法在影响分类效果不大的情况下能达到快速分类的目的。相似文献

11.

基于Ward’s方法的k-平均优化算法及其应用

下载免费PDF全文

邱苏林王丽珍《计算机工程与应用》2008,44(31):169-172

通过对k-平均算法存在不足的分析,提出了一种基于Ward’s方法的k-平均优化算法。算法首先在用Ward’s方法对样本数据初步聚类的基础上,确定合适的簇数目、初始聚类中心等k-平均算法的初始参数,并进行孤立点检测、删除;基于上述处理再采用传统k-平均算法进行聚类。将优化的k-平均算法应用到罪犯人格类型分析中,实验结果表明,该算法的效率、聚类效果均明显优于传统k-平均算法。相似文献

12.

一种基于人工鱼群的混合聚类算法 总被引：2，自引：0，他引：2

刘白周永权《计算机工程与应用》2008,44(18):136-138

聚类分析是数据挖掘的核心技术之一,它是一种无导师监督的模式识别方式。聚类分析就是按照数据间的相似程度,依据特定的准则将数据划分成不同子类。文中通过分析K-平均算法的优缺点,提出了一种基于人工鱼群算法的聚类分析算法,并把它与传统的K-平均算法结合得到一种新的混合聚类算法。仿真实验表明,该算法是有效的,具有聚类速度快、精度高特点。相似文献

13.

K均值和中值滤波混合算法及其递归实现

下载免费PDF全文

黄颖王卫星《计算机工程与应用》2009,45(17):26-27

针对标准中值滤波算法边缘保持能力较差的缺点,设计了K均值中值滤波算法和递归K均值中值滤波算法。使用K均值方法将中心像素点的邻域数据序列分成两类,将该像素点所属的这类数据的中值作为输出。为了加快算法的速度,提出了两个阈值T_L和T_H,保证在不影响结果精确性的同时尽量减少处理时间。传统的K均值算法耗时较高,论文的另一个改进是对K均值的优化处理,大大缩短了算法的处理时间。实验证明改进算法具有较好的噪声抑制能力和边缘保持能力。相似文献

14.

基于K-Means改进算法在微博话题发现中的应用研究

张云伟宋安军《计算机系统应用》2016,25(10):308-311

在传统的K-means算法中,聚类结果很大程度依赖于随机选择的初始聚类中心点以及人工指定的k值.为了提高聚类精度,本文提出了利用最小距离与平均聚集度来对初始聚类中心点进行选取,将层次聚类CURE算法得到的聚簇数作为k值,从而使聚类精度得到提高.最后,将改进后的K-means算法应用到微博话题发现中,通过对实验结果分析,证明该算法提高了聚类结果精度. 相似文献

15.

一种半监督K均值多关系数据聚类算法 总被引：1，自引：0，他引：1

高滢刘大有齐红刘赫《软件学报》2008,19(11):2814-2821

提出了一种半监督K均值多关系数据聚类算法.该算法在K均值聚类算法的基础上扩展了其初始类簇的选择方法和对象相似性度量方法,以用于多关系数据的半监督学习.为了获取高性能,该算法在聚类过程中充分利用了标记数据、对象属性及各种关系信息.多关系数据库Movie上的实验结果验证了该算法的有效性. 相似文献

16.

Two-phase clustering process for outliers detection

《Pattern recognition letters》2001,22(6-7):691-700

In this paper, a two-phase clustering algorithm for outliers detection is proposed. We first modify the traditional k-means algorithm in Phase 1 by using a heuristic “if one new input pattern is far enough away from all clusters' centers, then assign it as a new cluster center”. It results that the data points in the same cluster may be most likely all outliers or all non-outliers. And then we construct a minimum spanning tree (MST) in Phase 2 and remove the longest edge. The small clusters, the tree with less number of nodes, are selected and regarded as outlier. The experimental results show that our process works well. 相似文献

17.

基于变异精密搜索的蜂群聚类算法

罗可李莲周博翔《控制与决策》2014,29(5):838-842

针对K-means 聚类算法过度依赖初始聚类中心、局部收敛、稳定性差等问题, 提出一种基于变异精密搜索的蜂群聚类算法. 该算法利用密度和距离初始化蜂群, 并根据引领蜂的适应度和密度求解跟随蜂的选择概率P; 然后通过变异精密搜索法产生的新解来更新侦查蜂, 以避免陷入局部最优; 最后结合蜂群与粗糙集来优化K-means. 实验结果表明, 该算法不仅能有效抑制局部收敛、减少对初始聚类中心的依赖, 而且准确率和稳定性均有较大的提高.

相似文献

18.

Automatic clustering using an improved artificial bee colony optimization for customer segmentation

R. J. Kuo Ferani E. Zulvia 《Knowledge and Information Systems》2018,57(2):331-357

In cluster analysis, determining number of clusters is an important issue because information about the most appropriate number of clusters do not exist in the real-world problems. Automatic clustering is a clustering approach which is able to automatically find the most suitable number of clusters as well as divide the instances into the corresponding clusters. This study proposes a novel automatic clustering algorithm using a hybrid of improved artificial bee colony optimization algorithm and K-means algorithm (iABC). The proposed iABC algorithm improves the onlooker bee exploration scheme by directing their movements to a better location. Instead of using a random neighborhood location, the improved onlooker bee considers the data centroid to find a better initial centroid for the K-means algorithm. To increase efficiency of the improvement, the updating process is only applied on the worst cluster centroid. The proposed iABC algorithm is verified using some benchmark datasets. The computational result indicates that the proposed iABC algorithm outperforms the original ABC algorithm for automatic clustering problem. Furthermore, the proposed iABC algorithm is utilized to solve the customer segmentation problem. The result reveals that the iABC algorithm has better and more stable result than original ABC algorithm. 相似文献

19.

Minimum spanning tree based split-and-merge: A hierarchical clustering method

Caiming Zhong Duoqian Miao Pasi Fränti 《Information Sciences》2011,181(16):3397-3410

Most clustering algorithms become ineffective when provided with unsuitable parameters or applied to datasets which are composed of clusters with diverse shapes, sizes, and densities. To alleviate these deficiencies, we propose a novel split-and-merge hierarchical clustering method in which a minimum spanning tree (MST) and an MST-based graph are employed to guide the splitting and merging process. In the splitting process, vertices with high degrees in the MST-based graph are selected as initial prototypes, and K-means is used to split the dataset. In the merging process, subgroup pairs are filtered and only neighboring pairs are considered for merge. The proposed method requires no parameter except the number of clusters. Experimental results demonstrate its effectiveness both on synthetic and real datasets. 相似文献