首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
《现代电子技术》2019,(17):106-108
为了提高大数据环境下数据聚类的准确性,文中采用狼群优化算法实现数据聚类。对大数据集合进行狼群模拟训练,将数据结合中的多个数据采用狼群游走及围攻策略进行数据训练,不断更新数据在多维空间中的位置分布,根据数据所处位置与中心点的距离来判断数据所属类别,从而完成数据聚类。经过实验证明,相比于K-Means聚类算法和DBSCAN聚类算法,文中所提算法聚类优势明显。  相似文献   

2.
针对传统K-means算法对初始聚类中心选取的问题,提出了基于数据样本密度和距离来选取初始聚类中心的改进K-means算法,该算法保证了初始中心点集的第一点为确定的(最大密度点),在基于距离最远的其他中心点搜索过程中,得到的中心点也基本上是确定的,消除了初始中心点选择的随机性,同时保证了获得较高质量的初始中心点。理论分析和实验结果表明:改进的k-means算法是一种有效的入侵检测方法,根据此方法设计的入侵检测系统是有效可行的。  相似文献   

3.
《现代电子技术》2020,(3):177-182
在大数据的数据挖掘模型中,普遍采用模糊聚类算法进行数据分析。常用的模糊C均值聚类算法即FCM聚类算法,具有较多明显缺点,如抗噪性偏低、收敛速度慢、聚类数目无法自动确定等。常用的增量式模糊聚类方法通常在原有的以一个中心点为集群代表的基础上,改为选取多中心点进行增量式聚类算法的分析。但是,通过这样的算法进行数据分析也存在一定的问题,主要表现在其中心点选择是固定的,灵活性很差。基于以上原因,文中将对原有基础算法做出改进,主要对大数据中数据挖掘模型的增量型模糊聚类算法做出分析,经实践验证,改进后算法切实可行,普适性较强。  相似文献   

4.
为了克服传统层次聚类算法由于两类合并造成的中心点偏移的严重缺陷,提出了一种基于类中心矫正的层次聚类算法,从而提高了算法的精确度;同时继承了传统层次聚类对初始中心点的无依赖性;经分析,算法对于已知聚类数和未知聚类数两种情况均有着良好的聚类效果.通过标准数据测试,结果表明新算法的聚类性能与层次聚类算法相比有更高的精确度;并且让新算法用于指导图像分割实验,证明了算法的有效性.  相似文献   

5.
K?medoids算法具有对初始聚类中心敏感,聚类准确度不高及时间复杂度大的缺点。基于此,文中提出一种优化的K?medoids算法;该算法在已有的粒计算初始化基础上进行了改进,以对象之间的相似性作为判断依据,结合最大最小法初始化聚类中心,能有效地获取最佳或近似最佳的聚类中心;在优化的粒计算前提下,提出了基于微粒子动态搜索策略,以初始中心点作为基点,粒子内所有对象到其中心的平均距离为半径,形成一个微粒子;在微粒子内部,采用离中心点先近后远的原则进行搜索,能有效地缩小搜索范围,提高聚类准确率。实验结果表明:在UCI多个标准数据集中测试,且与其他改进的K?medoids算法比较分析,该算法在有效缩短收敛时间的同时保证了算法聚类准确率。  相似文献   

6.
快速准确的在海量网络数据中发现热点主题对于网络舆情监控具有重要作用.针对K-means算法对初始中心点选择敏感和全局搜索能力不足的问题,提出一种基于Hadoop的改进灰狼优化K-means的IGWO-KM算法.首先,该算法将灰狼优化算法和K-means算法相结合,利用灰狼优化算法收敛速度快和可全局寻优的优势为K-means搜索最佳聚类中心,减小随机选取初始中心点而导致的聚类结果不稳定性,以获取更好的聚类结果.其次,使用非线性收敛因子改进灰狼优化算法,协调算法的全局和局部的搜索能力.然后,引入正弦余弦算法并进行改进,增强灰狼优化算法的全局搜索能力,优化寻优精度和收敛速度,避免陷入局部最优.之后,使用近邻空间球减少K-means聚类过程中冗余的距离计算加快算法收敛.最后,利用Hadoop集群可批量处理数据的特性,实现算法的并行化.实验结果表明,IGWO-KM算法具有更好的寻优精度和稳定性,相比于GWO-KM算法和K-means,该算法在查准率、召回率和F值均有明显提高,且具有良好的收敛速度和拓展性.  相似文献   

7.
李乐  陈鸿昶 《通信技术》2009,42(3):263-265
基于层次的聚类方法是聚类分析算法的基本方法之一,但是由于其自身的缺点(如:合并后不能撤消等)往往会导致聚类质量不高。文中通过将一种改进的遗传算法用于聚类分析中,实现了层次聚类,并通过改进遗传算法参数,以提高算法的性能,这样既改善了基本遗传算法收敛慢、易陷入局部最优解的问题,同时又加快了聚类速度,减小误差。  相似文献   

8.
齐浩  马力 《电子设计工程》2015,(2):48-50,53
文中基于使传统聚类算法能够满足当前大数据分析的对计算效率的需求,采用将传统聚类算法分布式化的方法提高传统聚类算法效率。结合近年来广泛使用的Map Reduce分布式处理模型,对K-means、PAM、CLARA 3种算法进行了分布式化实验,并从数据规模和节点数量两个方面考察、讨论了一些影响并行算法性能的因素。实验分析表明,该方法能够有效地将聚类方法并行化,并可以应用在分布式系统当中。  相似文献   

9.
一种新的连续性LOD实现算法   总被引:1,自引:1,他引:0  
为进一步提高网格简化速度和实现连续性的层次细节(LOD),文中利用球形包围体对模型顶点进行分割,通过基于视距的误差阈值和最小误差聚类算法综合控制包围球的体积大小并对包围球的顶点进行聚类.实验结果显示,该算法能够较快、高保真地对模型网格进行简化,并解决了传统算法在层次细节实现上非连续性的问题,证明该算法是有效和实用的.  相似文献   

10.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

11.
基于K-均值聚类和势函数法的欠定盲分离   总被引:1,自引:0,他引:1  
杨静  张玉洁  李宏伟 《电信科学》2012,28(1):98-101
K-均值聚类法能估计出观测信号聚类直线方向,利用主成分分析(PCA)提取主成分,可以提高直线估计的精准度和鲁棒性.在此思想的指导下,本文提出基于K-均值聚类的势函数法.势函数度量了聚类中心与所有观测点的距离,对势函数求导得到更新聚类中心的迭代公式,利用该公式对K-均值聚类法得到的聚类中心进行调整得到精估计.该算法计算量较小,能有效估计出混合矩阵.仿真实验验证了算法的有效性.  相似文献   

12.
王东  王理想 《半导体光电》2014,35(5):904-907
提出了一种基于距离相似性K-means的红外图像聚类算法。该算法对通过Isomap算法降维后的空间点,进一步进行聚类;算法中引入了密度因素,通过距离相似性的差异进一步排除孤立点和选取初始聚类中心,使数据内部的紧凑性得到加强。经过实验证明,改进后的方法比原方法更有效,时间复杂度也大幅度降低。  相似文献   

13.
图像分割技术在各个领域中应用广泛,简单描述了模糊C均值聚类算法,在此基础上利用图像( l,α,β)颜色空间分离,将亮度空间进行二次聚类,根据像素点到第二次聚类中心的隶属度所得整幅图像的聚类域。能有效的将灰度图像或彩色图像中相似区域聚集分类,为图像预处理提供很大帮助。通过实验验证了算法的有效性。  相似文献   

14.
聂茹 《电信科学》2018,34(11):41-47
在分析经典谱聚目标函数与加权核k-means目标函数等价基础上,设计了一种基于抽样子空间约束的改进大规模数据谱聚类算法,算法通过加权核k-means迭代优化避免矩阵特征分解的大量资源被占用,通过数据抽样及聚类中心的子空间约束,避免全部核矩阵都被使用,从而降低经典算法的时间空间复杂度。理论分析和实验结果表明,改进算法保持与经典算法相近聚类精度,提高了聚类效率,验证了改进算法的有效性。  相似文献   

15.
为解决城市道路中相邻车辆聚类精度低的问题,本文提出了一种改进的密度峰值模糊聚类算法。首先,该算法使用自适应椭圆距离代替欧式距离,并在决策图中引入指数函数曲线选择密度峰值点,以确定初始聚类中心和聚类数目;接着,将初始信息代入模糊C均值(FCM)聚类算法中,经迭代计算取得一次聚类结果;最后,根据雷达数据中同一辆车的数据点速度差值极小、不同车辆的速度差值相对较大这一特征,引入和速度相关的目标函数,并通过迭代计算取得最终的聚类结果,以对一次聚类结果进行修正。根据真实道路测量数据的实验证明,本文提出的聚类算法精度高、鲁棒性好,能正确聚类城市道路中相邻的车辆目标,具有更好的聚类效果。为道路中车辆的跟踪、交通状态预估等处理提供可靠、准确的目标信息,大大减少后续工程的计算量。  相似文献   

16.
道路消失点检测是高级驾驶辅助系统中盲区监测的重要组成部分。针对现有消失点检测方法所存在的准确度低、运算量大等问题,提出一种基于车载视频图像的道路消失点检测算法。该算法在Harris角点检测基础上优化得分函数检测出图像特征点,减少在跟踪阶段的运算量;通过金字塔光流法和帧差距离对运动特征点进行跟踪,在结束帧上准确获得各特征点的位置;对特征点去除离值点后,通过优化初始聚类中心的K-Means聚类算法,得到车载视频图像的道路消失点。最后将算法应用于各种车辆行驶场景进行测试,在较短运行时间内,能准确检测出车载视频图像中道路消失点,证明算法鲁棒性好、运算简单易实现。  相似文献   

17.
范建德  谢维信  杜浩翠 《信号处理》2020,36(11):1838-1845
本文提出了一种改进的多源约束聚类算法,以解决多传感器多目标跟踪(Multi-Object Tracking/Estimation, MOTD)问题。MOTD问题对应于在缺乏噪声和目标运动模型等先验信息的情况下,对多个传感器的量测数据进行聚类。针对现有算法对选定传感器量测敏感的问题,本文提出的算法首先根据选定传感器量测数据点的局部密度,对该传感器量测数据进行筛选排序;其次,对排序后的每一个量测数据点,计算和其他传感器量测的高斯核距离,每个传感器返回距离最小的数据点;最后计算在截断距离内的数据点的数量,当大于给定阈值时判定这些数据点为目标产生的量测,簇的中心(个数)即为目标的位置(个数)。实验结果表明,对比现有多源聚类算法,本文提出的算法在传感器目标检测概率较高的场景中聚类精度和聚类速度均有所改善。   相似文献   

18.
张丹娜  杨晓静 《信号处理》2019,35(7):1217-1223
针对walsh码软扩频信号盲解扩问题,提出一种改进密度峰聚类算法。该算法在已知伪码周期和码片速率的前提下,对接收数据进行分段处理,得到数据矩阵,随后计算数据点的局部密度和距离较高局部密度数据点的最短距离,最后的采用自动确定聚类中心的密度峰聚类算法估计伪码序列规模数和伪码序列。该算法具有在较低信噪比条件下,实现walsh码软扩频信号盲解扩的特点。仿真结果表明,在信噪比较低时,本文算法能够准确估计伪码序列规模数和伪码序列,且时间复杂度较低。   相似文献   

19.
模糊C均值聚类对初始参数有着较强的依赖性,文中针对其对初始聚类中心敏感的问题,提出利用量子粒子群来优化FCM的初始聚类中心。粒子群优化算法具有较强的全局搜索能力,但局部搜索能力不足,因此借助于量子理论,将粒子群量子化,借助量子旋转门改变粒子的移动,同时利用量子非门增加种群的多样性,加强粒子群优化算法的局部寻优能力。并最终利用量子粒子群优化算法搜寻FCM算法的初始聚类中心,通过实验仿真表明,改进的算法在加快搜索速度的同时,能获得较为稳定的聚类中心且分割效果明显优于标准的FCM算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号