首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
核k-means算法是标准k-means算法的扩展,提高了k-means聚类中对非线性不可分数据的聚类效果.传统核k-means算法的初始中心是随机选取的,导致出现聚类时间较慢、聚类性能低等问题.文中提出了一种基于D2权重的核k-means算法,它根据点对簇内距离的贡献,选取对其贡献最大的点为簇中心,然后在核空间内进行相应的聚类.在UCI数据集上进行实验,实验结果表明,新算法相对于传统的核k-means算法,可以有效地缩短聚类时间,并提高聚类的质量,新算法性能优于传统的核K-means算法.  相似文献   

2.
聚类是最常用的数据挖掘算法之一.为了提高聚类结果的质量,应用拉格朗日乘数法提出了一种基于属性权重最优化的k-means聚类算法.该算法在计算样本与质心的距离时为各属性赋予相应的权重以表示属性的重要程度,并在每轮迭代中根据质心向量的变化自动计算最优的属性权重,使得所有样本与相应质心的距离和最小.实验结果验证了该方法相对于传统k-means算法的优势.  相似文献   

3.
针对k-means算法需要人为给出聚类个数k、聚类结果严重依赖初始聚类中心的选等问题,提出一种基于数据场的k-means改进算法。该算法通过计算每个数据点的势值,根据聚类中心的势值比周围邻居的势值大,并与其它聚类中心有相对较大距离的特点,从而确定k个聚类中心;最后将其它数据点按k-means算法聚类。仿真实验表明,改进算法在不需要人为设定参数的情况下能准确找出聚类个数k以及初始聚类中心。  相似文献   

4.
一种基于密度的k-means聚类算法   总被引:1,自引:0,他引:1  
针对k-means算法中对初始聚类中心和孤立点敏感的缺点,提出一种基于密度的改进k-means算法.该算法引入信息熵和加权距离,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,使得聚类中心相对稳定.实验表明,该算法在准确性、运行效率上均有10%以上的提升.  相似文献   

5.
为提高雷达射频隐身能力,提出一种雷达功率自适应管控方法。在保证一定雷达探测性能的条件下,根据无源探测系统获得的威胁目标的距离和雷达反射截面积参数,利用k-means算法将威胁目标聚类,根据各个聚类中心参数确定雷达分级功率;以期望方向功率最大、其他方向功率最小为优化目标,利用补偿因子对传统多尺度谐振子量子优化算法(MQHOA)进行改进,求解出最佳阵元开关序列;基于截获因子定义了射频隐身措施效率。仿真表明,改进MQHOA算法得到更优的目标函数解,基于k-means算法的功率分级准则提高了射频隐身措施效率。  相似文献   

6.
针对Deep Web的查询需求,文章提出了改进的对Deep Web数据源的分类方法:在对数据源进行分类时,采用了KNN分类算法来进行。由于KNN分类算法的K值选的过大或者过小都会对分类结果产生影响,因此提出了对K值进行优化的改进的KNN算法。文章利用k-means聚类算法来进行聚类,分别计算取得每个类别的k个距离相近的数据并计算这k个数据到聚类中心的距离,把这个距离的倒数作为该数据点对分类结果的贡献值。对训练集进行聚类后返回聚类中心,根据聚类中心计算权重,从而进一步来计算每个类别中k个最近邻贡献值之和S,选取S最大的类别作为测试数据的类别来进行分类,从而可达到比较好的分类效果。  相似文献   

7.
研究了聚类分析技术在网络推荐系统中的应用。由于k均值(k-means)聚类算法易受到局部最优与噪声点等因素的影响,文章结合DBSCAN(Density-based Spatial Clustering of Application with Noise)算法和MMD(Max-Min Distance)初始聚类中心选取算法,对原始k-means算法进行了改进,提出了DMK(Density-based and Max-min-distance K-means)算法。该算法使用DBSCAN选取高密度点作为第一个聚类中心点的备选范围,接着选择相距最远的K-1个点作为其余的K-1个聚类中心,然后用得到的这组初始聚类中心进行k-means聚类。仿真与实验结果表明,该算法选择的初始聚类中心比较分散且代表性好,聚类的迭代次数减少,聚类结果的纯度提高。  相似文献   

8.
针对传统K-means算法对初始聚类中心选取的问题,提出了基于数据样本密度和距离来选取初始聚类中心的改进K-means算法,该算法保证了初始中心点集的第一点为确定的(最大密度点),在基于距离最远的其他中心点搜索过程中,得到的中心点也基本上是确定的,消除了初始中心点选择的随机性,同时保证了获得较高质量的初始中心点。理论分析和实验结果表明:改进的k-means算法是一种有效的入侵检测方法,根据此方法设计的入侵检测系统是有效可行的。  相似文献   

9.
传统K-means算法中,随机选择到的初始聚类中心不同会得到不一样的簇类,人工给定的k值与实际聚类数较难达到一致,针对这些问题,文中提出了基于密度和聚类指数改进的K-means聚类算法。根据密度获取高密度集HP,从此集合中选择相互之间距离最大的两对对象均值当成第一轮聚类的聚类中心,新的聚类中心可通过最大距离积法获取,并参考聚类指数确定合适的k值。通过进行实验确认了该算法有较高的准确性和有效性。  相似文献   

10.
针对IRC僵尸网络频道的检测问题,提出一种基于流量特征的检测方法。分析了僵尸网络频道数据流在不同周期内流量的聚类性、相似性、平均分组长度、流量高峰和协同流量高峰等特征,并以此作为僵尸网络频道检测的依据。检测过程中,采用改进的最大最小距离和k-means聚类分析算法,改善了数据聚类的效果。最后经过实验测试,验证了方法的有效性。  相似文献   

11.
研究了基于异构k-means聚类的隐私保护算法。在隐私保护现有的聚类方法基础上,为了解决异构隐私k-means聚类算法可用性较差的问题,提出了IDP k-means算法,并证明其满足异构隐私保护。仿真实验表明,在相同的隐私保护级别下,IDP k-means聚类方法与异构隐私k-means聚类方法相比,聚类可用性得到了提高。  相似文献   

12.
《现代电子技术》2019,(7):162-166
传统K-medoids聚类算法随机选取初始聚类中心,存在迭代次数增加、聚类结果波动较大的问题,因此提出基于全覆盖粒计算的K-medoids文本聚类算法。该算法定义了全覆盖平均粒度重要性的概念。首先对文本进行Single-Pass粗聚类,利用全覆盖粒度重要性和平均粒度重要性从粗聚类结果中产生初始聚类中心候选集,再基于密度和最大最小距离法则从候选集中选出初始聚类中心。通过实验验证,该算法的聚类迭代次数明显减小,聚类质量明显提高。  相似文献   

13.
针对海量彩色图像聚类问题,本文引入改进型k-means算法并将其应用于彩色图像聚类中。该算法由类内-类间距离加权k-means算法和基于近邻传播聚类算法的类数量上界确定方法组成。在实验中,彩色图像的亮度分量的局部二值模式(Local Binary Pattern,LBP)图被重组成行向量,然后构成样本集,本文所提出的改进型k-means算法被用于对样本集进行聚类处理。实验结果显示,在多个聚类方法常用的评价指标上,本方法相比于传统方法达到了更高的聚类准确度。同时,相比于传统方法,本方法也更具有执行效率。  相似文献   

14.
针对k-means算法的聚类结果对初始聚类中心的选取较为敏感、选择聚类数目存在一定的主观性以及离群数据影响的问题,提出了一种结合孤立森林和鲸鱼优化算法的三支k-means算法(iF-W-TWKM)。首先利用孤立森林算法对数据集进行清洗,将数据集划分为两个子集:正常数据子集和异常数据子集。使用正常数据子集进行后续算法步骤,待算法结束后使用得到的聚类中心将异常数据子集中的样本划分到各类簇的边界域。利用鲸鱼优化算法建立以STDI为目标函数的优化问题进行全局寻优实现聚类中心的选取,避免局部最优。实验结果表明,改进后的算法在ACC、AS、DBI指标上整体优于k-means和TK-means,具有更好的聚类表现。  相似文献   

15.
为了解决传统k-means算法需要输入k值和在超大规模数据集进行聚类的问题,这里在前人研究基础上,首先在计算距离时引入信息熵,在超大规模数据集采用数据抽样,抽取最优样本数个样本进行聚类,在抽样数据聚类的基础上进行有效性指标的验证,并且获得算法所需要的k值,然后利用引入信息熵的距离公式再在超大数据集上进行聚类。实验表明,该算法解决了传统k-means算法输入k值的缺陷,通过数据抽样在不影响数据聚类质量的前题下自动获取超大数据集聚类的k值。  相似文献   

16.
兰红  闵乐泉 《电视技术》2013,(17):17-21
针对模糊C均值聚类(FCM)算法在含噪声图像分割中存在的运算开销大、收敛速度慢等不足,在抑制式RC-FCM算法的基础上提出一个结合邻域信息的改进抑制式FCM算法,算法通过构建图像灰度及邻域信息的二维直方图设定聚类样本空间和初始聚类,根据样本到聚类中心的最大和最小距离动态设定抑制因子,再通过改进的最小抑制FCM算法实现图像分割。实验表明改进算法不仅能够提高FCM算法的聚类速度,而且提高了对噪声图像的分割精度。  相似文献   

17.
针对模糊C均值聚类(FCM)算法在含噪声图像分割中存在的运算开销大、收敛速度慢等不足,在抑制式RC-FCM算法的基础上提出一个结合邻域信息的改进抑制式FCM算法,算法通过构建图像灰度及邻域信息的二维直方图设定聚类样本空间和初始聚类,根据样本到聚类中心的最大和最小距离动态设定抑制因子,再通过改进的最小抑制FCM算法实现图像分割.实验表明改进算法不仅能够提高FCM算法的聚类速度,而且提高了对噪声图像的分割精度.  相似文献   

18.
一种基于距离调节的聚类算法   总被引:2,自引:1,他引:1  
针对k-means算法不适合凹形样本空间的问题,提出了一种基于距离调节的聚类算法.算法中引入了一种调节最短路径距离作为算法的相似度函数,该函数可以使经过高密度数据区域的两点距离缩短,而经过低密度数据区域的两点距离加长,由此来缩小类间样本的相似度,同时加大类间的相似度,以及更好的聚类.实验结果证明,该算法对凹状的聚类样本空间具有很好的聚类效果.  相似文献   

19.
针对FCM彩色图像分割算法需要给定聚类数且受初始值影响较大的缺点,提出一种自适应FCM彩色图像分割算法。该方法首先引入主分量变换,通过直方图分析,在RGB彩色空间上自动确定聚类数目,其次引入2D直方图,分析对角线投影1D直方图,并采用最大最小距离法选取初始聚类中心。利用该算法分别对人工合成的和真实的彩色图像进行分割实验,实验结果表明:本文算法能够有效且自适应地分割彩色图像。  相似文献   

20.
聂茹 《电信科学》2018,34(11):41-47
在分析经典谱聚目标函数与加权核k-means目标函数等价基础上,设计了一种基于抽样子空间约束的改进大规模数据谱聚类算法,算法通过加权核k-means迭代优化避免矩阵特征分解的大量资源被占用,通过数据抽样及聚类中心的子空间约束,避免全部核矩阵都被使用,从而降低经典算法的时间空间复杂度。理论分析和实验结果表明,改进算法保持与经典算法相近聚类精度,提高了聚类效率,验证了改进算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号