首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
杨峰  刘胜强 《电子设计工程》2022,30(3):113-116,121
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进.对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题.提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能...  相似文献   

2.
针对雷达数据集中目标和杂波点迹的聚类不平衡问题,提出一种基于改进AdaBoost的密度峰值聚类法.介绍密度峰值聚类法的思想,基于不对称误分代价改进AdaBoost的误差函数,提高正类错分代价权重,将改进AdaBoost和密度峰值聚类结合,对由目标和杂波点迹组成的不平衡雷达数据集聚类.仿真实验结果表明,该算法在保证总体聚...  相似文献   

3.
传统的多进制正交幅度调制信号调制方式的识别方法,是对信号的星座图进行减法聚类,通过得到的聚类中心个数确定调制阶数,从而完成识别。由于信号的数据长度及聚类半径对识别性能的影响很大,为降低一定数据长度下聚类半径对识别效果的影响,提出了结合减法聚类和最大似然估计理论的改进识别方法,并给出了识别流程。仿真结果表明,在一定条件下,改进算法对信噪比的要求低于传统方法约6dB。  相似文献   

4.
基于划分的数据挖掘K-means聚类算法分析   总被引:1,自引:0,他引:1  
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。  相似文献   

5.
一种改进的快速HCM颜色聚类算法   总被引:1,自引:1,他引:0  
针对传统HCM算法运算时间过长且易陷入局部最优解的缺点,提出一种结合金字塔结构与减法聚类的HCM算法.该算法先将图像描述为不同尺度上的金字塔图像序列,对顶层图像运用减法聚类确定初始中心后进行HCM,然后依次将上一层图像的聚类结果作为初始中心对本层图像进行HCM聚类,对最底层聚类得到的结果即是最终的聚类结果.仿真试验表明,该算法的运行时间远远低于传统HCM算法,且聚类质量比传统HCM算法好.  相似文献   

6.
聚类分析一直是机器学习和数据挖掘领域一个比较活跃而且极具挑战性的研究方向.Alex提出的基于局部密度的聚类算法是一种快速、有效的聚类方法,但该方法通过手工选取确定聚类个数和聚类中心.为此,对原算法进行改进,在初步选取候选聚类中心的基础上,使用基于密度连通的算法优化选取聚类中心,然后使用大密度最近邻方法确定样本类别.实验证明,该方法能有效解决聚类个数和聚类中心无法确定的问题,同时在聚类评价指标上显示出较好的聚类效果和性能.  相似文献   

7.
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。  相似文献   

8.
针对传统网格聚类算法仅能够去除空网格的问题,提出一种基于图像分割思想来剔除稀疏数据的多密度网格聚类算法.该算法对原始数据进行网格划分和数据映射,计算网格密度,将每个网格看作图像中的一个像素点,采用Otsu算法确定合适阈值,并给出了阈值应用于网格聚类算法时的阈值折合公式,完成稀疏单元的剔除.在聚类过程中考虑到网格单元内部特征,通过两个网格的相对密度及边界特征得到了相邻网格的相似度度量公式,弥补了网格聚类算法无法应对多密度数据的缺点.在Matlab中进行仿真实验,该算法在聚类之前对网格剔除率为69%,且不需要人工干预,而GAMD和SNN算法未剔除网格.当数据维度增加时,GAMD算法时间远远高于本算法.实验证明,该算法具有较好的数据过滤效果,聚类结果与数据输入顺序无关,在得到任意簇的同时,保证了较高的时间效率且能够广泛应用于各种数据集.  相似文献   

9.
针对传统网格聚类算法应用于雷达信号分选中存在密度阈值不够合理、聚类精度较低的问题,提出了一种基于改进网格聚类的动态雷达信号分选算法。该算法引入CluStream聚类算法中的双层框架,增加了分选系统的实时性。通过双密度阈值策略和边缘稀疏网格优化处理,改进了传统网格聚类算法,合理地设置了密度阈值。仿真结果表明,该方法具备较高的抗干扰能力和聚类精度,取得了较好的分选效果。  相似文献   

10.
本文改进了Sheng的权和有效性函数,将XB、PE、PC和PBMF等模糊聚类有效性函数集成为一种新的模糊聚类有效性度量函数—模糊权和有效性函数FWSVF,从而提高了聚类有效性函数的性能.为了有效的实现聚类,将混合策略演化算法与传统的模糊C均值算法(FCM)相结合,将改进的模糊权和有效性指标作为适应度函数,提出了一种混合策略演化聚类算法MSECA.人工数据集和真实数据集的仿真实验表明,MSECA算法可以正确发现聚类簇的数量,避免了局部极值问题,比其他算法具有更好的性能.  相似文献   

11.
一种基于高斯分布的自适应 DBSCAN 算法   总被引:1,自引:0,他引:1  
针对传统的 DBSCAN 算法只能依靠经验来设置阈值(min Pts ,Eps)和无法对多密度数据集进行有效聚类的不足,提出了一种可适用于所有密度分布特征的数据集的基于高斯分布的自适应 DBSCAN 算法.该算法根据数据集的特点寻找最大的聚类效果指数(CEI)来确定 min Pts ,通过 Distk 图的层次数确定 Eps 个数并通过高斯分布中的参数估计来确定每个密度层次 Eps 大小,最后用所求得阈值进行聚类.将该算法与传统的 DBSCAN 算法分别应用于单密度数据集和多密度数据集,结果显示该算法更有效.  相似文献   

12.
基于相对密度的聚类算法和快速DBSCAN聚类算法是典型密度聚类算法DBSCAN的两种改进算法,但这两种方法仍存在不足.文中提出一种基于相对密度的快速聚类算法,实验证明了该方法的有效性.  相似文献   

13.
密度敏感的谱聚类   总被引:13,自引:2,他引:13       下载免费PDF全文
王玲  薄列峰  焦李成 《电子学报》2007,35(8):1577-1581
谱聚类是近来出现的一种性能极具竞争力的聚类方法,它的成功很大程度依赖于相似性度量的选择.本文通过分析这一性质并结合数据聚类特性,提出一种数据依赖的相似性度量--密度敏感的相似性度量.该相似性度量可以有效描述数据的实际聚类分布.将其引入谱聚类得到密度敏感的谱聚类算法.与原有的谱聚类算法相比,新算法不仅能够处理多尺度聚类问题,而且对参数选择相对不敏感.算法有效性分析以及实验验证了所提算法的有效性和可行性.  相似文献   

14.
云计算从分布式存储和分布式计算两个方面为大数据处理提供了强力的支持,并逐渐成为大数据挖掘的主流平台。但是在处理云平台中的大规模数据集时典型聚类挖掘算法存在一定不足,因此,提出一种基于群智能算法的大数据K-means聚类挖掘算法。首先对云计算Hadoop框架的存储数据能力和采用的Map Reduce计算模型进行分析,然后采用群智能算法对传统数据挖掘K-means聚类算法进行改进,解决其容易陷入局部最优问题。实验结果表明,相比加权K-means聚类算法,提出的改进算法表现出更好的聚类精度和运行速度,可以适用于大规模数据的聚类挖掘。  相似文献   

15.
提出了一种基于流域变换的多维数据聚类新方法.该方法以密度聚类技术为基础,通过对密度空间进行流域变换,实现多维数据的聚类.通过实验与基本聚类算法的比较,证明本文提出的算法对多维数据有更强的聚类能力.  相似文献   

16.
提出了一种基于流域变换的多维数据聚类新方法.该方法以密度聚类技术为基础,通过对密度空间进行流域变换,实现多维数据的聚类.通过实验与基本聚类算法的比较,证明本文提出的算法对多维数据有更强的聚类能力.  相似文献   

17.
为克服模糊规则提取的盲目性和随机性,提出了一种基于新的自适应模糊C-均值聚类(AFCM)算法的T-S 模糊建模方法.首先利用减法聚类来确定聚类数目的上限和初始聚类中心,然后采用改进的模糊C-均值聚类(FCM).算法进一步优化聚类中心,最后通过聚类有效性评判方法自适应地确定规则数及聚类中心,同时改进的FCM算法也克服了野...  相似文献   

18.
在图像处理大领域内,对特征值的处理尤为重要,而K-means算法是被运用于特征值聚类的重要方法之一,该方法简单快捷,聚类效果较佳,因而被学术界广泛使用。针对传统的K-means算法在进行数据集划分过程中的不足之处,提出了一种基于二分法的K-means聚类算法,该算法对数据集进行划分来选择出下次划分的数据集,以此来形成迭代,实验表明该算法相比于传统算法在划分方面有了明显的改进。  相似文献   

19.
针对基于密度的聚类算法不能发现密度分布不均匀数据样本的问题,提出了一种基于自适应密度阈值的未知雷达信号分选算法。该方法利用同一部雷达数据的分布特性进行聚类,通过寻找局部密度阈值,以达到分选不同密度分布的雷达信号的目的,并且在此基础上提出一个引理,提升了算法的时间效率。算法测试表明,该方法对噪声不敏感,能够发现任意形状、大小和密度的聚类。  相似文献   

20.
传统的基于地标点的大规模加速谱聚类算法易受分布不均匀地标点和离群地标点影响.K-means等采样方法在面对大规模数据时,时间空间消耗较大.针对以上问题,文中提出了一种改进地标点采样的加速谱聚类算法.该算法通过地标点间成对相似度矩阵的标准差来衡量地标点的分布均匀程度,选取随机的多组地标点集中分布最均匀的一组,去除局部密度...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号