首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到11条相似文献,搜索用时 78 毫秒
1.
在目前聚类方法中, k-means与势函数是最常用的算法,虽然两种算法有很多优点,但也存在自身的局限性。 k-means聚类算法:其聚类数目无法确定,需要提前进行预估,同时对初始聚类中心敏感,且容易受到异常点干扰;势函数聚类算法:其聚类区间范围有限,对多维数据进行聚类其效率低。针对以上两种算法的缺点,提出了一种基于 K-means 与势函数法的改进聚类算法。它首先采用势函数法确定聚类数目与初始中心,然后利用K-means法进行聚类,该改进算法具有势函数法“盲”特性及K-means法高效性的优点。实验对改进算法的有效性进行了验证,结果表明,改进算法在聚类精度及收敛速度方面有很大提高。  相似文献   

2.
最大距离法选取初始簇中心的K-means文本聚类算法的研究   总被引:1,自引:0,他引:1  
由于初始簇中心的随机选择, K-means算法在聚类时容易出现聚类结果局部最优、聚类结果不稳定、总迭代次数较多等问题。为了解决K-means算法所存在的以上问题, 提出了最大距离法选取初始簇中心的K-means文本聚类算法。该算法基于这样的事实:距离最远的样本点最不可能分到同一个簇中。为使该算法能应用于文本聚类, 构造了一种将文本相似度转换为文本距离的方法, 同时也重新构造了迭代中的簇中心计算公式和测度函数。在实例验证中, 对分属于五个类别的1 500篇文本组成的文本集进行了文本聚类分析, 其结果表明, 与原始的K-means聚类算法以及其他的两种改进的K-means聚类算法相比, 新提出的文本聚类算法在降低了聚类总耗时的同时, F度量值也有了明显提高。  相似文献   

3.
李涵  包立辉 《计算机应用与软件》2006,23(10):126-127,133
针对目前网络入侵检测现状,提出了将聚类算法应用到异常入侵检测中,并对K-means算法进行了改进。实验采用KDD Cup1999的测试数据,结果表明该方法是有效的。  相似文献   

4.
K-Means算法,也称为K-均值,是数据挖掘研究中是一种最基本的算法,也是应用最广泛的聚类算法.在电子商务、入侵检测、CRM等领域有较多的应用实例.它是一种cluster analysis的算法,其实现主要通过不断循环迭代地选取离种子点最近均值的过程.本文结合企业实际应用阐述k-means的实现过程、具体的改进思路以...  相似文献   

5.
传统的基于欧氏距离和K-means聚类算法的空值估计算法容易因为欧氏距离对量纲的敏感性和初始聚类中心对K-means聚类效果的影响产生估值误差。将层次聚类算法和K-means聚类算法有机结合起来的H-K聚类算法克服了K-means算法对初始聚类中心的敏感性,从而改善了聚类效果。与欧氏距离不同,马氏距离可以避免量纲的影响。为此提出一种改进的空值估计算法,将H-K聚类应用到空值估计算法中进行聚类,在聚类时采用马氏距离代替欧氏距离,在聚类后使用多元线性回归法计算样本中的空值。实验结果表明改进后的空值估计算法使得估计值的绝对误差率(MAER)得到降低。  相似文献   

6.
在计算机集成制造系统中,质量评估是质量管理极其重要的组成部分。质量评估的结果将直接影响管理层的经营决策。本文主要阐述如何把专家系统技术应用于质量评估,并建造质量评估专家系统。该专家系统充分利用集成环境所提供的准确、及时的信息数据,借助于人类质量管理的理论和经验,运用计算机自动推理,获得综合质量的评估  相似文献   

7.
为了有效地提高丈本聚类的质量和效率,在对已有的层次聚类和K-means算法分析和研究的基础上,针对互联网信息处理量大、实时性高的特点,设计并实现了一种用于高维稀疏相似矩阵的文本聚类算法.该算法结合了层次聚类和K-means聚类的思想,根据一个阈值来控制聚类算法的选取和新簇的建立,并通过文本特征提取和文档相似度矩阵计算实现文本聚类.实验结果表明,该算法的召回率和正确率更高.  相似文献   

8.
郝晓丽  张靖 《计算机科学》2014,41(6):260-263
针对传统径向基函数神经网络构造的网络分类器通常存在分类精度不高、训练时间长等缺陷,首先提出了一种改进的自适应聚类算法,用于确定分类器的隐含层节点。该算法通过筛选基于轮廓系数的优秀样本群,来寻找最佳初始聚类中心,避免了传统K-means算法易受初始聚类中心点影响,导致最终的分类效果严重偏离全局等情况的发生。其次,将该改进算法用于构造径向基函数神经网络分类器和快速有效地确定隐含层节点径向基函数中心及函数的宽度。最后,通过大量UCI数据集的实验和仿真,验证了改进算法在聚类时间、聚类轮廓系数及聚类正确率等方面具有优越性。同时,大量的仿真实验也证明了基于改进算法构造的RBF分类器具有更高的分类精度。  相似文献   

9.
高原  耿国华  王怡 《计算机应用》2006,26(4):870-871
提出了一种新的基于动态矩形的聚类方法DRCA。该方法减少了参与聚类计算的数据元素的数量,在每一次基本聚类过程中,采用数据之间空间位置比较取代复杂的聚类距离函数计算,使得算法复杂度与数据量具有近似线性时间关系。试验结果表明了DRCA的正确性和有效性。  相似文献   

10.
协同设计和协同仿真在产品设计中起着越来越重要的作用,对设计方案和仿真结果的评估也逐渐成为产品设计的一个重要环节.然而,依靠单领域进行设计评估往往考虑的内容不够全面,导致设计结果无法达到理想的状态.针对舰艇武器系统是涉及多领域的复杂系统这一特点,为满足多领域评估的要求,提出了舰艇武器系统协同评估专家系统的体系结构,研究了协同专家系统的知识库和推理技术,开发了原型系统.通过多个子专家系统协同来解决复杂问题,在实践中取得了理想的效果.  相似文献   

11.
旨在研究基于Web环境下利用Fuzzy理论进行妇科疾病诊断的专家系统.在分析三I算法的基础上,根据提炼出的妇科疾病诊断规则,建立了妇科疾病诊断Fuzzy推理的一般性模型,给出求解该模型基于RM算子的三I算法,并在asp.net平台下实现了该模型的简化算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号