首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 223 毫秒
1.
王军  周凯  程勇 《计算机应用》2019,39(2):403-408
密度峰值聚类(DP)算法是一种新的基于密度的聚类算法,当它处理的单个聚类包含多个密度峰值时,会将每个不同密度峰值视为潜在聚类中心,以致难以在数据集中确定正确数量聚类,为此,提出一种混合的密度峰值聚类算法C-DP。首先,以密度峰值点为初始聚类中心将数据集划分为子簇;然后,借鉴代表点层次聚类算法(CURE),从子簇中选取分散的代表点,将拥有最小距离的代表点对的类进行合并,引入参数收缩因子以控制类的形状。仿真实验结果表明,在4个合成数据集上C-DP算法比DP算法聚类效果更好;在真实数据集上的Rand Index指标对比表明,在数据集S1上,C-DP算法比DP算法性能提高了2.32%,在数据集4k2_far上,C-DP算法比DP算法性能提高了1.13%。由此可见,C-DP算法在单个类簇中包含多密度峰值的数据集中能提高聚类的准确性。  相似文献   

2.
由于存在大量服从高斯分布的样本数据,采用高斯混合模型(Gaussian Mixture Models,GMM)对这些样本数据进行聚类分析,可以得到比较准确的聚类结果.通常采用EM算法(Expectation Maximization Algorithm)对GMM的参数进行迭代式估计.但传统EM算法存在两点不足:对初始聚类中心的取值比较敏感;迭代式参数估计的迭代终止条件是相邻两次估计参数的距离小于给定的阈值,这不能保证算法收敛于参数的最优值.为了弥补上述不足,提出采用密度峰值聚类(Density Peaks Clustering,DPC)来初始化EM算法,以提高算法的鲁棒性,采用相对熵作为EM算法的迭代终止条件,实现对GMM算法参数值的优化选取.在人工数据集及UCI数据集上的对比实验表明,所提算法不但提高了EM算法的鲁棒性,而且其聚类结果优于传统算法.尤其在服从高斯分布的数据集上的实验结果显示,所提算法大幅提高了聚类精度.  相似文献   

3.
针对传统基于物品的推荐算法由于数据稀疏性导致的低推荐精度问题,提出了一种融合GMM聚类和FOA-GRNN模型的推荐算法。该算法首先使用高斯混合模型(GMM)方法对物品特征进行聚类;然后根据聚类结果分别构造评分矩阵,并使用Slope One算法填充评分矩阵;最后计算用户对物品的相似度预测评分作为输入,通过FOA-GRNN模型输出最终的评分。基于movielens-2k数据集的实验结果表明,与其他3种算法相比,该算法能够更好地处理高稀疏性数据,推荐精度更优,并能够在一定程度上解决冷启动问题。  相似文献   

4.
一种基于贪心EM算法学习GMM的聚类算法   总被引:2,自引:0,他引:2  
传统的聚类算法如k-means算法需要一些先验知识来确定初始参数,初始参数的选择通常会对聚类结果生产很大的影响.提出一种新的基于模型的聚类算法,通过优化给定的数据和数学模型之间的适应性发现数据对模型的最好匹配.由于高斯混合模型可以看作是一种"软分配聚类"方法,该算法结合一种贪心的EM算法来学习高斯混合模型(GMM),由贪心EM算法实现高斯混合模型结构和参数的自动学习,而不需要先验知识.这种聚类算法可以克服k-means等算法的缺点,实验结果表明该算法具有更好的聚类效果.  相似文献   

5.
针对核模糊C-均值(KFCM)聚类算法存在易陷入局部极小值,对初始值敏感的缺点。将混合蛙跳算法(shuffled frog leaping algorithm,SFLA)用于KFCM中,但在聚类数较大和维数较高时,聚类效果不理想,为此提出将自适应惯性权重引入混合蛙跳算法的更新策略中,再用改进后的混合蛙跳算法求得最优解作为KFCM算法的初始聚类中心,利用KFCM算法优化初始聚类中心,求得全局最优解,从而有效克服了KFCM算法的缺点。人造数据和经典数据集的实验结果表明,新算法与KFCM和FCM聚类算法相比,寻优能力更强,迭代次数更少,聚类效果更好。  相似文献   

6.
基于k-means和半监督机制的单类中心学习算法   总被引:2,自引:0,他引:2  
提出了一个基于k means算法框架和半监督机制的single means算法,以解决单类中心学习问题。k means算法实质上是对一种混合高斯模型的期望最大化(EM)算法的近似,对该模型随机生成的多类混合数据集,从目标类中随机标定的初始中心出发,能确定地收敛到该类的实际中心。将single means算法应用到对单类文本中心学习问题中,实验结果表明:在给定目标类中的小标定文本集后,新算法能够有效地改进类的初始中心,且对数据稀疏和方差较大的实际问题具有健壮性。  相似文献   

7.
经典[K]-Means算法不能有效处理非球型数据集的聚类问题,且聚类目标数需预先指定。SMCL(Self-adaptive Multiprototype-based Competitive Learning)算法是一种[K]-Means的改进算法,它引入Multi-Prototypes机制,并将距离相近的Prototypes所代表的样本簇融合成聚类簇。在SMCL算法基础上提出DP-SMCL(Density Peak-SMCL)算法,使用密度峰值聚类算法确定初始聚类中心集,借助1-D高斯混合概率密度模型合并以Prototypes为中心的相近子簇来获得精确聚类结果。实验结果表明,DP-SMCL算法可应用于非球型数据集聚类,且能自动确认聚类的目标类别数,相比于[K]-Means和DBSCAN(Density-Based Spatial Clustering of Applications with Noise)等经典聚类算法能够获得更加准确的聚类结果。同时,与SMCL算法相比,DP-SMCL可以快速完成初始Prototypes的选定,显著提升算法准确率和执行效率。  相似文献   

8.
邱保志  程栾 《计算机应用》2018,38(9):2511-2514
针对聚类算法的聚类中心选取需要人工参与的问题,提出了一种基于拉普拉斯中心性和密度峰值的无参数聚类算法(ALPC)。首先,使用拉普拉斯中心性度量对象的中心性;然后,使用正态分布概率统计方法确定聚类中心对象;最后,依据对象到各个中心的距离将各个对象分配到相应聚类中心实现聚类。所提算法克服了算法需要凭借经验参数和人工选取聚类中心的缺点。在人工数据集和真实数据集上的实验结果表明,与经典的具有噪声的基于密度的聚类方法(DBSCAN)、密度峰值聚类(DPC)算法以及拉普拉斯中心峰聚类(LPC)算法相比,ALPC具有自动确定聚类中心、无参数的特点,且具有较高的聚类精度。  相似文献   

9.
FCM算法用于灰度图像分割的初始化方法的研究   总被引:2,自引:1,他引:1  
匡泰  朱清新  孙跃 《计算机应用》2006,26(4):784-786
模糊C均值聚类(FCM)算法是一种经典的模糊聚类分析方法,但其算法初始聚类中心集是随机选取的,从而造成算法的性能强烈的依赖聚类中心集的初始化。提出了一种改进的基于多项式求解的FCM(PFCM)算法,该算法基于求解多项式的根来确定数据集初始聚类中心集,很好地解决了数据初始聚类中心集问题,使数据初始聚类中心集代表了数据集类别的特征,在此基础上,采用FCM算法得到聚类中心集的近似最优解。  相似文献   

10.
基于样本空间分布密度的初始聚类中心优化K-均值算法*   总被引:2,自引:1,他引:1  
针对传统K-均值聚类算法对初始聚类中心敏感、现有初始聚类中心优化算法缺乏客观性,提出一种基于样本空间分布密度的初始聚类中心优化K-均值算法。该算法利用数据集样本的空间分布信息定义数据对象的密度,并根据整个数据集的空间信息定义了数据对象的邻域;在此基础上选择位于数据集样本密集区且相距较远的数据对象作为初始聚类中心,实现K-均值聚类。UCI机器学习数据库数据集以及随机生成的带有噪声点的人工模拟数据集的实验测试证明,本算法不仅具有很好的聚类效果,而且运行时间短,对噪声数据有很强的抗干扰性能。基于样本空间分布密度的初始聚类中心优化K-均值算法优于传统K-均值聚类算法和已有的相关K-均值初始中心优化算法。  相似文献   

11.
K-means初始聚类中心的选择算法   总被引:1,自引:0,他引:1  
郑丹  王潜平 《计算机应用》2012,32(8):2186-2192
K-means算法随机选取初始聚类中心,容易造成聚类准确率低且聚类结果不稳定。针对这一问题,提出一种初始聚类中心的选择算法。通过k-dist的差值(DK)图分析,确定数据点在k-dist图上的位置,选择主要密度水平曲线上k-dist值最小的点作为初始聚类中心。实验证明,改进算法选择的初始聚类中心唯一,聚类结果稳定,聚类准确率高,迭代次数少。  相似文献   

12.
当前混合属性数据发布中隐私保护方法大多存在隐私保护效果不佳或数据效用较差的问题,采用差分隐私与优化的k-prototype聚类方法相结合,提出改进k-prototype聚类的差分隐私混合属性数据发布方法(DCKPDP)。为解决传统k-prototype聚类算法没有考虑不同数值型属性对聚类结果有较大影响的问题,利用信息熵为每个数值型属性添加属性权重;为解决聚类初始中心点人为规定或者由随机算法随机确定,导致聚类结果精确度不高的问题,结合数据对象的局部密度和高密度对聚类过程中初始中心点进行自适应选择;为解决数据信息泄露风险较高的问题,对聚类中心值进行差分隐私保护。实验结果表明,DCKPDP算法满足差分隐私保护所需的噪声量更小,数据的可用性更好。  相似文献   

13.
梁冰  徐华 《计算机应用》2017,37(9):2600-2604
针对核模糊C均值(KFCM)算法对初始聚类中心敏感、易陷入局部最优的问题,利用人工蜂群(ABC)算法的构架简单、全局收敛速度快的优势,提出了一种改进的人工蜂群算法(IABC)与KFCM迭代相结合的聚类算法。首先,以IABC求得最优解作为KFCM算法的初始聚类中心,IABC在迭代过程中将与当前维度最优解的差值的变化率作为权值,对雇佣蜂的搜索行为进行改进,平衡人工蜂群算法的全局搜索与局部开采能力;其次,以类内距离和类间距离为基础,构造出适应KFCM算法的适应度函数,利用KFCM算法优化聚类中心;最后,IABC和KFCM算法交替执行,实现最佳聚类效果。采用3组Benchmark测试函数6组UCI标准数据集进行仿真实验,实验结果表明,与基于改进人工蜂群的广义模糊聚类(IABC-KGFCM)相比,IABC-KFCM对数据集的聚类有效性指标提高1到4个百分点,具有鲁棒性强和聚类精度高的优势。  相似文献   

14.
王治和  王淑艳  杜辉 《计算机工程》2021,47(5):88-96,103
模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征。提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法。通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题。在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数。基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度。  相似文献   

15.
基于聚类算法可以对多个属性聚类的特点,提出一种基于快速求解高斯混合模型的聚类算法,用于研究网络流量的分类,使其达到更佳的聚类效果。通过与其他算法比较,讨论了该种方法在流量聚类中的适用性。仿真结果表明,该方法聚类精度高,经过初始聚类中心后的EM算法用于求解GMM有较高的估算准确性,有效地提高了EM算法的收敛速度。  相似文献   

16.
修超  曹林  王东峰  张帆 《计算机应用》2017,37(10):3017-3023
利用多目标交通测速雷达进行交通执法时,只有正确地判断出车辆所在的车道,抓拍照片才能作为交通执法的依据。传统的分车道方法主要通过人工测量的固定阈值以及坐标系旋转的方法来达到车道划分的目的,但这种方法误差较大并且不易于操作。基于统计和密度特征的核聚类算法(K-CSDF)分两步进行:首先对雷达获取的车辆数据进行特征提取,包括基于统计特征的阈值处理和基于密度特征的动态半径提取;然后引入基于核的相似性的动态聚类算法对筛选出的有效点进行聚类。通过和高斯混合模型(GMM)算法以及自组织映射神经网络(SOM)算法进行仿真对比表明:当只取100个有效点进行聚类时,K-CSDF和SOM算法能达到90%以上的分车道正确率,而GMM算法不能给出车道中心线;在算法用时上,当取1000个有效点时,K-CSDF和GMM算法用时均小于1s,可以保证实时性,而SOM算法则需要2.5s左右;在算法鲁棒性上,K-CSDF对不均匀样本的适应性优于这两种算法。当取不同数量的有效点进行聚类时,K-CSDF可以达到95%以上的平均分车道正确率。  相似文献   

17.
孙建军  徐岩 《计算机应用》2020,40(6):1769-1773
语音欠定混合矩阵估计问题中,针对模糊C均值聚类(FCM)算法对初始聚类中心敏感、易受噪声点干扰、鲁棒性差的缺陷,提出一种基于加权的进化规划与FCM相结合的改进算法(WE-FCM)。首先,利用进化规划(EP)算法强大的搜索能力优化FCM得到基于进化规划的FCM算法(EP-FCM),以获得较佳的初始聚类中心;然后,利用局部离群点检测(LOF)算法对EP-FCM加权以降低噪声点的影响。通过仿真实验得出,所提算法在源信号数为3路和4路时归一化均方误差值与偏离角度值均远小于经典的K均值聚类(K-means)算法、K-Hough、基于遗传算法的FCM算法(GAFCM)和基于密度峰值的FCM算法(FDP-FCM)。实验结果表明,所提算法明显提高了FCM算法的鲁棒性和混合矩阵的估计精度。  相似文献   

18.
许允喜  陈方 《计算机应用》2008,28(6):1546-1548
为了解决传统高斯混合模型(GMM)对初值敏感,在实际训练中极易得到局部最优参数的问题,提出了一种采用微粒群算法优化GMM参数的新方法。该方法将最大似然估计融入到微粒群算法迭代过程中,形成了新的混合算法。它利用微粒群算法的全局优化性及最大似然估计的局部寻优性求解高斯混合模型的参数,以提高参数精度。说话人辨认实验表明,与传统的方法相比,新方法可以得到更优的模型参数,使得系统的识别率进一步提高。  相似文献   

19.
K-prototypes算法是处理混合属性数据的主要聚类算法,但是存在对初值敏感、参数依赖和易受噪声干扰等问题。为了克服以上缺点,该文对K-prototypes算法的初始中心点选择进行了研究与分析,提出了一种基于近邻法的初始中心点选择策略对算法进行改进,算法先利用近邻法获得初始中心点集和k值,然后进行K-prototypes运算,最后加入识别异常数据点的规则。改进后的算法成功解决了传统K-prototypes算法的缺陷,而且具有更好的分类精度和稳定性。经实验证明,改进算法是正确和有效的,明显优于传统的K-prototypes算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号