首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
近几年来,随着互联网的发展以及大数据时代的来临,具有多种表示即多视图数据越来越多,如何将传统的单一表示的数据聚类方法应用在多视图数据被广泛研究。其中传统的K-均值聚类算法因为有效性以及对于大数据的高效性而被扩展到了多视图数据领域,本文针对最近提出的一个新的多视图K-均值聚类方法,结合co-training的思想,提出了一个改进的多视图K-均值聚类算法,并在三个标准数据集上进行了实验,同时和已有的一些方法进行了比较,结果表明了算法的有效性。  相似文献   

2.
基于核的K-均值聚类   总被引:17,自引:0,他引:17  
孔锐  张国宣  施泽生  郭立 《计算机工程》2004,30(11):12-13,80
将核学习方法的思想应用于K-均值聚类中,提出了一种核K-均值聚类算法,算法的主要思想是:首先将原空间中待聚类的样本经过一个非线性映射,映射到一个高维的核空间中,突出各类样本之间的特征差异,然后在这个核空间中进行K-均值聚类。同时还将一种新的核函数应用于核K-均值聚类中以提高算法的速度。为了验证算法的有效性,分别利用人工和实际数据进行K-均值聚类和核K-均值聚类,实验结果显示对于一些特殊的类分布数据,核K-均值聚类比K-均值聚类具有更好的聚类效果。  相似文献   

3.
传统的K-均值算法,因对初始聚类中心的选择敏感,存在容易陷入局部最优解的缺点,差分演化算法是一类基于种群的启发式全局搜索技术,对于实值参数的优化具有很强的鲁棒性。为了克服K-均值聚类算法的上述缺点,提出基于差分演化的K-均值聚类算法,该方法结合K-均值算法的高效性和差分演化算法的全局优化能力,较好地解决了聚类中心优化问题。通过实验结果表明,此算法能够有效改善聚类质量。  相似文献   

4.
K-均值聚类是一种被广泛应用的方法。本文提出了基于K-均值聚类的改进算法,并应用于图像分割。针对K-均值聚类算法对离群点的反应过强的缺点,通过替换中心点,比较代价函数,来达到改进划分结果的目的。实验结果表明,该方法能有效改善聚类中心,提高分类精度和准确性。  相似文献   

5.
K-均值聚类是一种被广泛应用的方法。本文提出了基于K-均值聚类的改进算法,并应用于图像分割。针对K-均值聚类算法对离群点的反应过强的缺点,通过替换中心点,比较代价函数,来达到改进划分结果的目的。实验结果表明,该方法能有效改善聚类中心,提高分类精度和准确性。  相似文献   

6.
应用K-均值聚类的方法区分源于不同目标的观测数据,通过类间数据融合,实现对多目标的实时跟踪。研究了观测数据K-均值聚类的基本思想、聚类处理过程及算法实现,讨论了对机动目标跟踪的Kalman滤波方程及空管系统中易于计算的各参数矩阵理论依据及相应的初值。发现通过K-均值聚类能很好区分不同目标,聚类后再进行跟踪融合更加准确。仿真结果表明,经K-均值聚类处理后的滤波跟踪航迹效果较好。  相似文献   

7.
基于初始聚类中心优化的K-均值算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对传统的K-均值算法对初始聚类中心的选取和孤立点敏感的问题,本文提出了一种基于点密度的初始聚类中心选取方法。利用该方法选出初始聚类中心,再应用K-均值算法进行聚类,同时对孤立点进行特殊处理。实验表明,该方法能够产生高质量的聚类结果。  相似文献   

8.
基于改进K-均值聚类的快速分形图像编码算法   总被引:2,自引:0,他引:2  
将先进的K-均值聚类理论引入到分形图像编码领域,是目前国际学术界的研究热点之一.本文全面分析了K-均值聚类的初始聚类中心选取问题,给出了基于均值一标准差的初始聚类中心选取新方案,并据此提出了一种新的快速分形图像编码算法.仿真实验表明,本文所提出的快速分形图像编码算法是一种高效的图像压缩方法,不仅其压缩效果明显优于传统K_均值聚类分形图像压缩方案,而且具有较短的编码时间.同时,该算法还具有较强的通用性与适应性(传统K-均值分形编码方法对于纹理图像压缩效果较差,而本文算法的压缩效果却较理想).  相似文献   

9.
基于K-均值聚类的改进非选择算法研究   总被引:3,自引:0,他引:3  
文章提出了一种基于K-均值聚类的改进非选择算法,其核心是对检测器集进行K-均值聚类,将检测器集分为多个子类,根据子类中心和待检测数据的亲和度选择若干个合适的子类进行实际检测。文中对算法的检测过程进行了分析,并给出了该算法用于入侵检测时的测试实验结果。实验结果表明,文章算法在检测速度上有明显改善。  相似文献   

10.
针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,提出一种基于数据空间分布选取初始聚类中心的改进算法.该算法首先定义样本距离、样本平均差异度和样本集总体平均差异度;然后将每个样本按平均差异度排序,选择平均差异度较大且与已选聚类中心的差异度大于样本集总体平均差异度的样本作为初始聚类中心.实验表明,改进后的算法不仅提高了聚类结果的稳定性和正确率,而且迭代次数明显减少,收敛速度快.  相似文献   

11.
面向非球形分布数据的自适应K近邻聚类算法   总被引:2,自引:0,他引:2  
黄晓斌  万建伟  张燕 《计算机工程》2003,29(11):21-22,165
针对传统聚类算法处理非球形分布数据的不足,提出了一种新型的自适应K近邻聚类算法。该算法由数据集归一化、初始类别构造和初始类别融合3个步骤构成。仿真结果表明,该算法在无须聚类数目的前提下,对非球型分布数据具有很好的聚类效果。  相似文献   

12.
为解决传统聚类算法不能处理非球形分布数据的问题,文犤5犦提出了一种自适应k近邻聚类算法。该算法在无需聚类数目的前提下,能有效解决非球形分布数据的聚类问题。但进一步的研究表明,该算法在处理带“奇异”样本的数据集时失去效果。为此,该文给出了一种改进的自适应k近邻聚类算法。仿真结果表明,新算法不仅保持了原算法在处理非球形分布数据时的优良特性,还成功解决了“奇异”样本问题。  相似文献   

13.
在处理大数据集聚类初始化问题时,随机子样法是一种重要的数据约简操作.对随机取样的过程、特征及缺陷进行了分析,提出一种基于KD树子样的聚类初始化方法.该方法利用KD树将样本空间以递归方式细分成多个子空间,并分别在各子空间中随机取样形成KD树子样,有效避免了随机子样分布有偏的不足,使得子样中好的聚类初始点也能很好的表达整个...  相似文献   

14.
一种基于粒子群的聚类算法   总被引:2,自引:0,他引:2  
姚丽娟  罗可  孟颖 《计算机工程与应用》2012,48(13):150-153,175
针对K-中心点算法对初始化敏感和容易陷入局部极值的缺点,提出一种基于粒子群算法和密度初始化改进的K-中心点聚类算法。该算法初始化时选择距离较远的k个候选范围作为k个聚类中心的选择范围,即粒子的初始值都在该k个范围内。通过粒子群算法优化聚类中心,以解决K-中心点算法因为聚类中心迭代计算较为复杂而导致的时间复杂度较高的问题。实验结果表明,该算法具有较高的正确率,较小的时间复杂度,综合性能更加稳定。  相似文献   

15.
基于向量空间模型的文本聚类算法   总被引:15,自引:3,他引:12       下载免费PDF全文
文本聚类是聚类的一个重要研究分支,是聚类方法在文本处理领域的应用。该文探讨了基于向量空间模型的文本聚类方法,提出了一种文本聚类的改进算法——LP算法。同时,基于语料库的实际聚类效果,就维度确定、特征选择等方面提出优化方案。实验证明,LP算法有效地减少了聚类所消耗的时间,实用性和灵活性都较高。  相似文献   

16.
徐晓  丁世飞  丁玲 《软件学报》2022,33(5):1800-1816
密度峰值聚类(density peaks clustering, DPC)算法是聚类分析中基于密度的一种新兴算法, 该算法考虑局部密度和相对距离绘制决策图, 快速识别簇中心, 完成聚类. DPC具有唯一的输入参数, 且无需先验知识, 也无需迭代. 自2014年提出以来, DPC引起了学者们的极大兴趣, 并得到了快速发展...  相似文献   

17.
基于EM算法的文本聚类优化研究   总被引:1,自引:0,他引:1  
针对现有的文本聚类算法难以取得满意结果的问题,以EM算法为基础,提出能分别描述相似、不相似聚类对的相似性分布以及重要、不重要文档的重要性分布的文本聚类优化模型(text clustering optimization model, TCOM).基于该模型,设计一种通过合并不同的文本聚类结果以获取最优性能的方法.实验结果表明,利用该方法同时改善了聚类精度和召回率,其性能优于单独使用现有的硬、软聚类算法.  相似文献   

18.
朱永利  陈涛 《计算机工程》2009,35(19):108-110
针对拓扑发现(TopDisc)算法构建的网络灵活性不强、重复执行算法的开销过大和没有考虑节点的剩余能量等缺点,对原算法进行分析与改进,并用OPNET网络仿真工具进行模拟仿真与性能分析。仿真结果证明,改进的TopDisc算法在节能性与稳定性等方面比原有算法有较大的提高。  相似文献   

19.
高斯混合模型聚类中EM算法及初始化的研究   总被引:6,自引:0,他引:6  
岳佳  王士同 《微计算机信息》2006,22(33):244-246
EM算法是参数估计的重要方法,其算法核心是根据已有的数据来迭代计算似然函数,使之收敛于某个最优值。EM算法收敛的优劣很大程度上取决于其初始参数。运用EM算法来实现高斯混合模型聚类,如何初始化EM参数便成为一个关键的问题。在比较其他的初始化方法的基础上,引入“binning”法来初始化EM。实验结果表明,应用binning法来初始化EM的高斯混合模型聚类优于其它传统的初始化方法。  相似文献   

20.
使用支撑集和模糊待分集的概念来描述数据集的分布,在此基础上提出了一种区域型模糊聚类算法———re-gionalfuzzyclusteringalgorithm。仿真结果表明该算法有比常用的模糊C均值更好的聚类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号