首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
多重系统聚类挖掘算法及其实现   总被引:5,自引:1,他引:4  
基于统计的系统聚类分析是一种重要的数据挖掘算法,但单纯的样本系统聚类有一些局限;该文提出一种多重系统聚类模型及其算法实现,将变量聚类和样本聚类结合起来,使分类性能有了较大提高.  相似文献   

2.
设计了一种在中英文环境下、能够对Nutch的搜索结果进行聚类处理的搜索结果聚类系统,该系统基于k-means算法和后缀树聚类算法,是一个由Nutch搜索引擎、文本分词、TF-IDF权重计算以及文本聚类等模块构成的搜索引擎结果文档聚类系统,并通过实验对k-means算法和后缀树算法进行了对比。  相似文献   

3.
王国辉  林果园 《计算机应用》2011,31(7):1898-1900
针对当前聚类算法仅依赖于初始聚类中心并且无法精确区别非凹形状类的不足,现将图学习知识应用到聚类算法中,提出了一种基于图聚类的入侵检测算法P-BFS。为得到较准确的分类模型,算法中引入了一种基于逼近函数的相似性度量方法。实验结果论证了图聚类思想应用于入侵检测系统的优越性;同时表明了,与K-means聚类算法相比,P-BFS图聚类算法具有较高的性能。  相似文献   

4.
潘大胜 《计算机仿真》2010,27(8):165-167,207
在优化文本文件问题的研究中,为了提高文本聚类的准确率,得到更高质量的聚类结果,在深入研究K-means算法的基础上,提出了一种改进的K-means聚类算法,并将算法应用于文本聚类仿真系统中。该算法可以自动计算聚类结果中簇的个数,消除了孤立点对聚类结果的影响,为建立文本聚类系统提供了先决条件。在文本聚类仿真实验中,对数据集进行了多次测试,测试结果表明基于改进K-means算法的文本聚类系统具有更好的聚类特性,取得了良好的应用效果。  相似文献   

5.
为提高聚类集成算法效率,弥补以往聚类集成算法的不足,确保多数聚类成员分簇的均匀无偏差,提出了一种新的基于聚类集成的多目标聚类分析框架,并利用系统能量理论定义了多目标聚类问题的优化目标函数。在此基础上,设计了一种启发式的K-ETMC聚类集成算法,并对Iris、Wine、Soybean三个数据集进行了快速有效的聚类分析,通过与MCLA,HGPA,CSPA三个典型聚类集成算法比较表明:该算法聚类效果较好,能够有效地改善聚类结果。  相似文献   

6.
柏青  苏旸 《计算机应用》2013,33(4):1077-1080
针对现有的网络安全防御系统主动性不足,对未知类型网络数据的判断速度慢、准确性不高的缺陷,设计了一种应用聚类算法对未知类型数据进行聚类分流的分布式蜜罐系统。在聚类过程中,采用一种改进的聚类中心选择算法,对未知类型网络数据进行模糊聚类,将聚类失败的数据分流到蜜罐中进行特征学习,从而尽早地发现新的攻击类型,减轻蜜罐的监控和记录压力,降低蜜罐被攻破的概率,有利于防御时采用更为有效的防御策略。此系统应用在政府某部门的专网中,实验结果验证了在不明显增加系统计算量的情况下,该聚类算法比平均值聚类算法有更高的聚类成功率。  相似文献   

7.
储岳中 《微机发展》2008,18(3):196-199
在RBF神经网络的各种学习算法中,最近邻聚类算法学习时间短、计算量小,不需要事先确定隐单元的个数,完成聚类所得到的网络是最优的,并且可以在线学习,是一种自适应聚类学习算法,非常适合非线性实时系统的应用。但常规最近邻聚类算法在实时性要求较高的系统预测中学习时间相对较长。针对这一问题,提出了系统离线学习时采用减聚类算法,在线学习时采用改进的最近邻聚类算法,并变步长修正聚类半径和限制学习样本数。在函数拟合实验中,这种改进算法明显缩短了RBF神经网络的学习时间,在钢包精炼炉电极系统的在线辨识中的成功应用进一步表明对最近邻聚类算法的改进是有效的。  相似文献   

8.
改进的RBF神经网络在非线性系统中的应用   总被引:1,自引:0,他引:1  
在RBF神经网络的各种学习算法中,最近邻聚类算法学习时间短、计算量小,不需要事先确定隐单元的个数,完成聚类所得到的网络是最优的,并且可以在线学习,是一种自适应聚类学习算法,非常适合非线性实时系统的应用.但常规最近邻聚类算法在实时性要求较高的系统预测中学习时间相对较长.针对这一问题,提出了系统离线学习时采用减聚类算法,在线学习时采用改进的最近邻聚类算法,并变步长修正聚类半径和限制学习样本数.在函数拟合实验中,这种改进算法明显缩短了RBF神经网络的学习时间,在钢包精炼炉电极系统的在线辨识中的成功应用进一步表明对最近邻聚类算法的改进是有效的.  相似文献   

9.
入侵检测是一种通过实时监测目标系统来发现入侵攻击行为的安全技术,传统的入侵检测系统在有效性、适应性和可扩展性方面都存在着不足。为了使模糊聚类算法获得的聚类结果为全局最优解,改进了传统的模糊C-均值算法,并且在每个聚类的数据集上建立一棵属于该聚类的C4.5决策树,构造了一种新的综合检测算法来确定是否存在入侵。通过实验结果分析,该检测算法降低了误报率,提高了入侵检测的检测性能以及可靠性。  相似文献   

10.
利用模糊满意聚类建立pH 中和过程模型   总被引:10,自引:1,他引:10  
利用模糊聚类方法建立 p H中和过程模型。针对模糊聚类中普遍存在的聚类个数需事先给定和收敛速度慢等问题 ,在原有聚类方法的基础上提出一种模糊满意聚类算法。该算法能快速确定系统的模糊划分数目 ,进而对应聚类个数建立相应的 TS局部线性化模型。以典型 p H中和过程为研究对象 ,利用上述方法建立其系统模型 ,取得了良好的仿真效果 ,验证了该聚类算法的快速性和有效性  相似文献   

11.
协同聚类算法是通过同时对文档和特征进行聚类的一种聚类算法,该算法可以挖掘文档内部特征之间的潜在关系从而达到提高聚类效果的目的。随着大数据时代的到来,算法的并行化显示出它的优越性,为此本文对协同聚类算法进行全面的研究,并扩展它的并行算法,研究基于最小化残差平方和的协同聚类算法,利用MapReduce模式设计与实现协同聚类算法的并行化。实验结果表明,本文提出的并行协同聚类算法能够提高聚类的效率,并具有很好的可扩展性。  相似文献   

12.
属性——统计混合聚类算法研究   总被引:2,自引:0,他引:2  
对属性———统计混合聚类算法进行研究。在属性均值聚类算法和Woodbury算法的基础上,对目标泛函进行改进,提出属性———统计混合聚类算法。文章证明了属性均值聚类算法和模糊C均值聚类算法(FCM)分别是属性-统计混合聚类算法的一个特例。  相似文献   

13.
模糊C-均值聚类算法是目前应用最广泛的聚类算法,但其仍然存在对孤立点敏感及对初始中心点依赖等问题.为此,提出了一种改进的基于样本加权的模糊聚类算法,该算法可以更加准确的获得初始中心点且去除噪声点.同时,针对Weka系统中聚类算法的薄弱性以及聚类问题在数据挖掘领域的广泛性,本文对此平台进行二次开发并对传统FCM算法与改进算法进行研究.研究发现,改进算法使得聚类结果稳定,且能准确获得聚类结果,提高了算法准确率.  相似文献   

14.
传统的谱聚类算法对初始化敏感,针对这个缺陷,引入Canopy算法对样本进行“粗”聚类得到初始聚类中心点,将结果作为K-Means算法的输入,提出了一种基于Canopy和谱聚类融合的聚类算法(Canopy-SC),减少了传统谱聚类算法选择初始中心点的盲目性,并将其用于人脸图像聚类。与传统的谱聚类算法相比,Canopy-SC算法能够得到较好的聚类中心和聚类结果,同时具有更高的聚类精确度。实验结果表明了该算法的有效性和可行性。  相似文献   

15.
一种基于密度的K-均值算法   总被引:1,自引:1,他引:0       下载免费PDF全文
针对传统的K-均值算法聚类时所面临的维数灾难、初始聚类中心点难以确定的缺点,提出一种改进的K-均值算法,其核心思想是通过降维、基于密度及散布的初始中心点搜索等方法改进K-均值算法。实验结果证明改进后的算法无论在聚类精度还是在稳定性方面,都明显优于标准的K-均值算法。  相似文献   

16.
孟颖  罗可  姚丽娟  王琳 《计算机工程与应用》2012,48(16):136-139,152
K-medoids算法作为聚类算法的一种,不易受极端数据的影响,适应性广泛,但是K-medoids聚类算法的精确度不稳定,平均准确率较低,用于实际的聚类分析时效果较差.ACO是一种仿生优化算法,其具有很强的健壮性,容易与其他方法相结合,求解效率高等特点.在K-medoids聚类算法的基础上,借鉴ACO算法的优点,提出了一种新的聚类算法,它提高了聚类的准确率,算法的稳定性也比较高.通过仿真实验,验证了算法的可行性和先进性.  相似文献   

17.
文本聚类中基于密度聚类算法的研究与改进   总被引:1,自引:0,他引:1  
文本聚类在很多领域都有广泛应用,而聚类算法作为文本聚类的核心直接决定了聚类的效果和效率。结合基于划分的聚类算法和基于密度的聚类算法的优点,提出了基于密度的聚类算法DBCKNN。算法利用了k近邻和离群度等概念,能够迅速确定数据集中每类的中心及其类半径,在保证聚类效果的基础上提高了聚类效率。  相似文献   

18.
张松  张琳 《计算机科学》2016,43(Z11):447-450
在数据挖掘中由于每个数据对象对于知识发现的作用是不同的,为了区分这些相异之处,给每个对象赋予一定量的值,因此在PAM聚类算法的基础上提出一种W-PAM(Weight Partitioning Around Medoids)聚类算法,它为簇中数据对象加入权重来提高算法的准确率,此外利用数据对象间的关联限制能够提高聚类算法的效果。探讨了一种W-PAM算法与关联限制相结合的限制聚类算法,该算法同时拥有W-PAM算法和关联限制的优点。实验结果证明,W-PAM的限制聚类算法可以更有效地利用所给的关联限制来改善聚类效果,提高算法的准确率。  相似文献   

19.
提出了一种新型的聚类算法。这个新型的聚类算法是基于中心对称的概念之上的。使用这种基于中心对称性的聚类算法,在一个指定的数据集中的超球面形状的聚类能够被侦测出来。在对超球面性状的目标的侦测方面,这种聚类算法大大优于传统的算法。这个算法可以用于数据聚类和人脸识别方面,实验结果也证明了该算法的效果。  相似文献   

20.
面对复杂信息环境下的数据预处理需求,提出了一种可以处理混合属性数据集的双重聚类方法。这种双重聚类方法由双重近邻无向图的构造算法或其改进算法,基于分离集合并的双重近邻图聚类算法、基于宽度优先搜索的双重近邻图聚类算法、或基于深度优先搜索的双重近邻图聚类算法来实现。通过人工数据集和UCI标准数据集的仿真实验,可以验证,尽管这三个聚类算法所采用的搜索策略不同,但最终的结果是一致的。仿真实验结果还表明,对于一些具有明显聚类分布结构且无近邻噪声干扰的数据集,该方法经常能取得比K-means算法和AP算法更好的聚类精度,从而说明这种双重聚类方法具有一定的有效性。为进一步推广并在实际中发掘出该方法的应用价值,最后给出了一点较有价值的研究展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号