共查询到20条相似文献,搜索用时 46 毫秒
1.
核k-means算法是标准k-means算法的扩展,提高了k-means聚类中对非线性不可分数据的聚类效果.传统核k-means算法的初始中心是随机选取的,导致出现聚类时间较慢、聚类性能低等问题.文中提出了一种基于D2权重的核k-means算法,它根据点对簇内距离的贡献,选取对其贡献最大的点为簇中心,然后在核空间内进行相应的聚类.在UCI数据集上进行实验,实验结果表明,新算法相对于传统的核k-means算法,可以有效地缩短聚类时间,并提高聚类的质量,新算法性能优于传统的核K-means算法. 相似文献
2.
聚类是最常用的数据挖掘算法之一.为了提高聚类结果的质量,应用拉格朗日乘数法提出了一种基于属性权重最优化的k-means聚类算法.该算法在计算样本与质心的距离时为各属性赋予相应的权重以表示属性的重要程度,并在每轮迭代中根据质心向量的变化自动计算最优的属性权重,使得所有样本与相应质心的距离和最小.实验结果验证了该方法相对于传统k-means算法的优势. 相似文献
3.
4.
一种基于密度的k-means聚类算法 总被引:1,自引:0,他引:1
针对k-means算法中对初始聚类中心和孤立点敏感的缺点,提出一种基于密度的改进k-means算法.该算法引入信息熵和加权距离,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,使得聚类中心相对稳定.实验表明,该算法在准确性、运行效率上均有10%以上的提升. 相似文献
5.
为提高雷达射频隐身能力,提出一种雷达功率自适应管控方法。在保证一定雷达探测性能的条件下,根据无源探测系统获得的威胁目标的距离和雷达反射截面积参数,利用k-means算法将威胁目标聚类,根据各个聚类中心参数确定雷达分级功率;以期望方向功率最大、其他方向功率最小为优化目标,利用补偿因子对传统多尺度谐振子量子优化算法(MQHOA)进行改进,求解出最佳阵元开关序列;基于截获因子定义了射频隐身措施效率。仿真表明,改进MQHOA算法得到更优的目标函数解,基于k-means算法的功率分级准则提高了射频隐身措施效率。 相似文献
6.
针对Deep Web的查询需求,文章提出了改进的对Deep Web数据源的分类方法:在对数据源进行分类时,采用了KNN分类算法来进行。由于KNN分类算法的K值选的过大或者过小都会对分类结果产生影响,因此提出了对K值进行优化的改进的KNN算法。文章利用k-means聚类算法来进行聚类,分别计算取得每个类别的k个距离相近的数据并计算这k个数据到聚类中心的距离,把这个距离的倒数作为该数据点对分类结果的贡献值。对训练集进行聚类后返回聚类中心,根据聚类中心计算权重,从而进一步来计算每个类别中k个最近邻贡献值之和S,选取S最大的类别作为测试数据的类别来进行分类,从而可达到比较好的分类效果。 相似文献
7.
《信息通信》2017,(7)
研究了聚类分析技术在网络推荐系统中的应用。由于k均值(k-means)聚类算法易受到局部最优与噪声点等因素的影响,文章结合DBSCAN(Density-based Spatial Clustering of Application with Noise)算法和MMD(Max-Min Distance)初始聚类中心选取算法,对原始k-means算法进行了改进,提出了DMK(Density-based and Max-min-distance K-means)算法。该算法使用DBSCAN选取高密度点作为第一个聚类中心点的备选范围,接着选择相距最远的K-1个点作为其余的K-1个聚类中心,然后用得到的这组初始聚类中心进行k-means聚类。仿真与实验结果表明,该算法选择的初始聚类中心比较分散且代表性好,聚类的迭代次数减少,聚类结果的纯度提高。 相似文献
8.
9.
10.
11.
研究了基于异构k-means聚类的隐私保护算法。在隐私保护现有的聚类方法基础上,为了解决异构隐私k-means聚类算法可用性较差的问题,提出了IDP k-means算法,并证明其满足异构隐私保护。仿真实验表明,在相同的隐私保护级别下,IDP k-means聚类方法与异构隐私k-means聚类方法相比,聚类可用性得到了提高。 相似文献
12.
13.
14.
针对k-means算法的聚类结果对初始聚类中心的选取较为敏感、选择聚类数目存在一定的主观性以及离群数据影响的问题,提出了一种结合孤立森林和鲸鱼优化算法的三支k-means算法(iF-W-TWKM)。首先利用孤立森林算法对数据集进行清洗,将数据集划分为两个子集:正常数据子集和异常数据子集。使用正常数据子集进行后续算法步骤,待算法结束后使用得到的聚类中心将异常数据子集中的样本划分到各类簇的边界域。利用鲸鱼优化算法建立以STDI为目标函数的优化问题进行全局寻优实现聚类中心的选取,避免局部最优。实验结果表明,改进后的算法在ACC、AS、DBI指标上整体优于k-means和TK-means,具有更好的聚类表现。 相似文献
15.
为了解决传统k-means算法需要输入k值和在超大规模数据集进行聚类的问题,这里在前人研究基础上,首先在计算距离时引入信息熵,在超大规模数据集采用数据抽样,抽取最优样本数个样本进行聚类,在抽样数据聚类的基础上进行有效性指标的验证,并且获得算法所需要的k值,然后利用引入信息熵的距离公式再在超大数据集上进行聚类。实验表明,该算法解决了传统k-means算法输入k值的缺陷,通过数据抽样在不影响数据聚类质量的前题下自动获取超大数据集聚类的k值。 相似文献
16.
针对模糊C均值聚类(FCM)算法在含噪声图像分割中存在的运算开销大、收敛速度慢等不足,在抑制式RC-FCM算法的基础上提出一个结合邻域信息的改进抑制式FCM算法,算法通过构建图像灰度及邻域信息的二维直方图设定聚类样本空间和初始聚类,根据样本到聚类中心的最大和最小距离动态设定抑制因子,再通过改进的最小抑制FCM算法实现图像分割。实验表明改进算法不仅能够提高FCM算法的聚类速度,而且提高了对噪声图像的分割精度。 相似文献
17.
针对模糊C均值聚类(FCM)算法在含噪声图像分割中存在的运算开销大、收敛速度慢等不足,在抑制式RC-FCM算法的基础上提出一个结合邻域信息的改进抑制式FCM算法,算法通过构建图像灰度及邻域信息的二维直方图设定聚类样本空间和初始聚类,根据样本到聚类中心的最大和最小距离动态设定抑制因子,再通过改进的最小抑制FCM算法实现图像分割.实验表明改进算法不仅能够提高FCM算法的聚类速度,而且提高了对噪声图像的分割精度. 相似文献
18.
一种基于距离调节的聚类算法 总被引:2,自引:1,他引:1
针对k-means算法不适合凹形样本空间的问题,提出了一种基于距离调节的聚类算法.算法中引入了一种调节最短路径距离作为算法的相似度函数,该函数可以使经过高密度数据区域的两点距离缩短,而经过低密度数据区域的两点距离加长,由此来缩小类间样本的相似度,同时加大类间的相似度,以及更好的聚类.实验结果证明,该算法对凹状的聚类样本空间具有很好的聚类效果. 相似文献
19.
针对FCM彩色图像分割算法需要给定聚类数且受初始值影响较大的缺点,提出一种自适应FCM彩色图像分割算法。该方法首先引入主分量变换,通过直方图分析,在RGB彩色空间上自动确定聚类数目,其次引入2D直方图,分析对角线投影1D直方图,并采用最大最小距离法选取初始聚类中心。利用该算法分别对人工合成的和真实的彩色图像进行分割实验,实验结果表明:本文算法能够有效且自适应地分割彩色图像。 相似文献
20.
在分析经典谱聚目标函数与加权核k-means目标函数等价基础上,设计了一种基于抽样子空间约束的改进大规模数据谱聚类算法,算法通过加权核k-means迭代优化避免矩阵特征分解的大量资源被占用,通过数据抽样及聚类中心的子空间约束,避免全部核矩阵都被使用,从而降低经典算法的时间空间复杂度。理论分析和实验结果表明,改进算法保持与经典算法相近聚类精度,提高了聚类效率,验证了改进算法的有效性。 相似文献