共查询到20条相似文献,搜索用时 0 毫秒
1.
针对高维稀疏聚类CABOSFV算法仅能解决二态变量高维稀疏聚类问题而对其他类型变量算法将失效的情况,通过定义“属性绝对值距离”解决了CABOSFV算法固有的这一缺陷。另外,针对聚类后产生伪孤立点问题,提出相应的异常数据处理策略,从而得到较为精确的离群数据。 相似文献
2.
3.
提出了对随机聚类方法加以改进的新型多层极小支配集聚类算法,首先讨论了图论中的极小支配集算法,并根据实际需要提出了一种改进的简化近极小支配集的算法,大大降低了计算极小支配集的复杂程度,然后讨论了极小支配集应用在无线传感器网络聚类的实现,最后验证了该算法在能耗方面的性能改进。 相似文献
4.
一种基于密度的k-means聚类算法 总被引:1,自引:0,他引:1
针对k-means算法中对初始聚类中心和孤立点敏感的缺点,提出一种基于密度的改进k-means算法.该算法引入信息熵和加权距离,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,使得聚类中心相对稳定.实验表明,该算法在准确性、运行效率上均有10%以上的提升. 相似文献
5.
针对多视图聚类中如何更好地融合不同视图之间信息的问题,提出了一种多视图聚类算法。采用谱聚类中的归一化割算法,得到每个单视图的嵌入矩阵。通过最小化最终的全局图与各单视图之间的差距来学习最终的全局图。考虑到不同视图的重要性不同,使用了一种自加权的方式为每个视图添加权重。利用秩约束的方式控制全局图的连通分量个数。聚类结果可以从最终学习得到的全局图中直接得出,每个连通分量即为一个簇。通过在两个真实数据集上进行实验,对比该算法与其他类似算法在相同数据集上的聚类评价指标,得出该算法的聚类指标相比于对比算法有最大12%的提升。 相似文献
6.
针对在支持向量聚类,当样本分布不均匀时,单宽度的高斯核限制了支持向量机泛化性能,影响了聚类效果的问题,提出一种基于加权多宽度高斯核函数的支持向量聚类算法。加权多宽度高斯核函数比单宽度的高斯核有更多的可调参数,通过多参数调节,可提高泛化能力,改善聚类效果。仿真实验表明,与单宽度的高斯核相比,加权多宽度高斯核可以有效聚类,从而证明了该算法的有效性。 相似文献
7.
在数据挖掘中,对于数据源中的孤立点的研究可以用于网络攻击、欺诈检测等领域。而Internet的广泛使用使得大量数据以时序性的流的形式存在。针对传统数据挖掘对流数据孤立点挖掘应用中所遇到的问题,文中提出了一个基于改进的距离和密度的孤立点挖掘算法。实验证明,该算法能够有效地检测到流数据中的局部孤立点,从而捕捉到数据流上的概念漂移,能更好地应用于实际。 相似文献
8.
9.
10.
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进.对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题.提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能... 相似文献
11.
聚类的根本在于对数据的划分与集合,数据可通过聚类算法对象的相似性与不同合集中对象的区别性来进行数据记录.近年来,由于数据库的信息量大量增长,在面对大规模数据集时,聚类分析的算法形式已经无法满足高内存,高CPU的时间限制,传统的数据算法正面临着"不高效"的严峻问题.本文旨在根据大规模数据集的背景,进一步分析聚类算法的优缺性,并针对其问题研究聚类新算法的设计方法. 相似文献
12.
针对传统K-Means聚类算法的不足,提出一种新的对孤立点不敏感的K-Means聚类算法。首先,采用孤立点移除算法消除数据集中存在的孤立点;然后,对不包含孤立点的数据集进行传统K-Means聚类,再引入轮廓系数并选择轮廓系数最大值对应的簇类数作为数据集中簇的最优选择数目K;最后,通过自定义的聚类有效性评价函数评估聚类效果。实验结果表明,相对于传统K-Means聚类算法,对孤立点不敏感的新的K-Means聚类算法能够消除孤立点对数据集整体的影响,并优化了聚类中心的选择。 相似文献
13.
14.
15.
现有的异常轨迹检测算法往往侧重于检测轨迹的空域异常,忽略了对轨迹时域异常的检测,并且检测精确度不高,针对此类问题,提出了基于增强聚类的异常轨迹检测算法。首先,采用基于速度的最小描述长度(VMDL)准则把轨迹简化成有序线段;然后,使用改进的线段间的距离定义,基于DBSCAN算法把线段分为不同的类,以建模局部正常运动模式;最后,采用先检测空间异常性再检测时间异常性的二级检测算法,检测时空异常轨迹点。在多个测试集上的实验结果表明:该算法可以检测位置、角度、速度等三种时空异常轨迹点,相对于其他算法,明显提高了异常轨迹检测的精确度。 相似文献
16.
针对传统网格聚类算法仅能够去除空网格的问题,提出一种基于图像分割思想来剔除稀疏数据的多密度网格聚类算法.该算法对原始数据进行网格划分和数据映射,计算网格密度,将每个网格看作图像中的一个像素点,采用Otsu算法确定合适阈值,并给出了阈值应用于网格聚类算法时的阈值折合公式,完成稀疏单元的剔除.在聚类过程中考虑到网格单元内部特征,通过两个网格的相对密度及边界特征得到了相邻网格的相似度度量公式,弥补了网格聚类算法无法应对多密度数据的缺点.在Matlab中进行仿真实验,该算法在聚类之前对网格剔除率为69%,且不需要人工干预,而GAMD和SNN算法未剔除网格.当数据维度增加时,GAMD算法时间远远高于本算法.实验证明,该算法具有较好的数据过滤效果,聚类结果与数据输入顺序无关,在得到任意簇的同时,保证了较高的时间效率且能够广泛应用于各种数据集. 相似文献
17.
基于观测值聚类的多雷达数据融合 总被引:4,自引:0,他引:4
采用一种改进的K NN算法对多雷达观测数据进行聚类 ,结合聚类中心和目标预测值 ,应用卡尔曼滤波器估计目标状态 ,从而实现多雷达数据融合。实验结果表明这种方法是有效的。 相似文献
18.
19.