共查询到20条相似文献,搜索用时 109 毫秒
1.
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进.对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题.提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能... 相似文献
2.
针对雷达数据集中目标和杂波点迹的聚类不平衡问题,提出一种基于改进AdaBoost的密度峰值聚类法.介绍密度峰值聚类法的思想,基于不对称误分代价改进AdaBoost的误差函数,提高正类错分代价权重,将改进AdaBoost和密度峰值聚类结合,对由目标和杂波点迹组成的不平衡雷达数据集聚类.仿真实验结果表明,该算法在保证总体聚... 相似文献
3.
4.
基于划分的数据挖掘K-means聚类算法分析 总被引:1,自引:0,他引:1
《现代电子技术》2020,(3):14-17
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法。首先将整体数据集分为k类,然后设定一个密度参数为■,该密度参数反映数据库中数据所处区域的密度大小,■值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果。最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类。 相似文献
5.
6.
7.
传统K-means算法的初始聚类中心从数据集中随机抽取,聚类结果会随着初始聚类中心的不同而产生波动。针对这一问题,提出一种基于密度的优化初始聚类中心选取算法,通过计算每个数据对象的密度参数和邻域距离,选取k个处于高密度分布的点作为初始聚类中心。在聚类类别数给定的情况下,使用标准的UCI数据库进行对比实验,发现改进后的算法较传统算法有相对较高的准确率和稳定性。 相似文献
8.
针对传统网格聚类算法仅能够去除空网格的问题,提出一种基于图像分割思想来剔除稀疏数据的多密度网格聚类算法.该算法对原始数据进行网格划分和数据映射,计算网格密度,将每个网格看作图像中的一个像素点,采用Otsu算法确定合适阈值,并给出了阈值应用于网格聚类算法时的阈值折合公式,完成稀疏单元的剔除.在聚类过程中考虑到网格单元内部特征,通过两个网格的相对密度及边界特征得到了相邻网格的相似度度量公式,弥补了网格聚类算法无法应对多密度数据的缺点.在Matlab中进行仿真实验,该算法在聚类之前对网格剔除率为69%,且不需要人工干预,而GAMD和SNN算法未剔除网格.当数据维度增加时,GAMD算法时间远远高于本算法.实验证明,该算法具有较好的数据过滤效果,聚类结果与数据输入顺序无关,在得到任意簇的同时,保证了较高的时间效率且能够广泛应用于各种数据集. 相似文献
9.
针对传统网格聚类算法应用于雷达信号分选中存在密度阈值不够合理、聚类精度较低的问题,提出了一种基于改进网格聚类的动态雷达信号分选算法。该算法引入CluStream聚类算法中的双层框架,增加了分选系统的实时性。通过双密度阈值策略和边缘稀疏网格优化处理,改进了传统网格聚类算法,合理地设置了密度阈值。仿真结果表明,该方法具备较高的抗干扰能力和聚类精度,取得了较好的分选效果。 相似文献
10.
本文改进了Sheng的权和有效性函数,将XB、PE、PC和PBMF等模糊聚类有效性函数集成为一种新的模糊聚类有效性度量函数—模糊权和有效性函数FWSVF,从而提高了聚类有效性函数的性能.为了有效的实现聚类,将混合策略演化算法与传统的模糊C均值算法(FCM)相结合,将改进的模糊权和有效性指标作为适应度函数,提出了一种混合策略演化聚类算法MSECA.人工数据集和真实数据集的仿真实验表明,MSECA算法可以正确发现聚类簇的数量,避免了局部极值问题,比其他算法具有更好的性能. 相似文献
11.
一种基于高斯分布的自适应 DBSCAN 算法 总被引:1,自引:0,他引:1
针对传统的 DBSCAN 算法只能依靠经验来设置阈值(min Pts ,Eps)和无法对多密度数据集进行有效聚类的不足,提出了一种可适用于所有密度分布特征的数据集的基于高斯分布的自适应 DBSCAN 算法.该算法根据数据集的特点寻找最大的聚类效果指数(CEI)来确定 min Pts ,通过 Distk 图的层次数确定 Eps 个数并通过高斯分布中的参数估计来确定每个密度层次 Eps 大小,最后用所求得阈值进行聚类.将该算法与传统的 DBSCAN 算法分别应用于单密度数据集和多密度数据集,结果显示该算法更有效. 相似文献
12.
基于相对密度的聚类算法和快速DBSCAN聚类算法是典型密度聚类算法DBSCAN的两种改进算法,但这两种方法仍存在不足.文中提出一种基于相对密度的快速聚类算法,实验证明了该方法的有效性. 相似文献
13.
14.
15.
16.
提出了一种基于流域变换的多维数据聚类新方法.该方法以密度聚类技术为基础,通过对密度空间进行流域变换,实现多维数据的聚类.通过实验与基本聚类算法的比较,证明本文提出的算法对多维数据有更强的聚类能力. 相似文献
17.
18.
19.
针对基于密度的聚类算法不能发现密度分布不均匀数据样本的问题,提出了一种基于自适应密度阈值的未知雷达信号分选算法。该方法利用同一部雷达数据的分布特性进行聚类,通过寻找局部密度阈值,以达到分选不同密度分布的雷达信号的目的,并且在此基础上提出一个引理,提升了算法的时间效率。算法测试表明,该方法对噪声不敏感,能够发现任意形状、大小和密度的聚类。 相似文献