首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对高维稀疏聚类CABOSFV算法仅能解决二态变量高维稀疏聚类问题而对其他类型变量算法将失效的情况,通过定义“属性绝对值距离”解决了CABOSFV算法固有的这一缺陷。另外,针对聚类后产生伪孤立点问题,提出相应的异常数据处理策略,从而得到较为精确的离群数据。  相似文献   

2.
3.
罗光春  李炯 《通信学报》2007,28(8):128-132
提出了对随机聚类方法加以改进的新型多层极小支配集聚类算法,首先讨论了图论中的极小支配集算法,并根据实际需要提出了一种改进的简化近极小支配集的算法,大大降低了计算极小支配集的复杂程度,然后讨论了极小支配集应用在无线传感器网络聚类的实现,最后验证了该算法在能耗方面的性能改进。  相似文献   

4.
一种基于密度的k-means聚类算法   总被引:1,自引:0,他引:1  
针对k-means算法中对初始聚类中心和孤立点敏感的缺点,提出一种基于密度的改进k-means算法.该算法引入信息熵和加权距离,从近邻密度出发,去除孤立点对算法的影响,同时确定初始聚类中心,使得聚类中心相对稳定.实验表明,该算法在准确性、运行效率上均有10%以上的提升.  相似文献   

5.
针对多视图聚类中如何更好地融合不同视图之间信息的问题,提出了一种多视图聚类算法。采用谱聚类中的归一化割算法,得到每个单视图的嵌入矩阵。通过最小化最终的全局图与各单视图之间的差距来学习最终的全局图。考虑到不同视图的重要性不同,使用了一种自加权的方式为每个视图添加权重。利用秩约束的方式控制全局图的连通分量个数。聚类结果可以从最终学习得到的全局图中直接得出,每个连通分量即为一个簇。通过在两个真实数据集上进行实验,对比该算法与其他类似算法在相同数据集上的聚类评价指标,得出该算法的聚类指标相比于对比算法有最大12%的提升。  相似文献   

6.
针对在支持向量聚类,当样本分布不均匀时,单宽度的高斯核限制了支持向量机泛化性能,影响了聚类效果的问题,提出一种基于加权多宽度高斯核函数的支持向量聚类算法。加权多宽度高斯核函数比单宽度的高斯核有更多的可调参数,通过多参数调节,可提高泛化能力,改善聚类效果。仿真实验表明,与单宽度的高斯核相比,加权多宽度高斯核可以有效聚类,从而证明了该算法的有效性。  相似文献   

7.
在数据挖掘中,对于数据源中的孤立点的研究可以用于网络攻击、欺诈检测等领域。而Internet的广泛使用使得大量数据以时序性的流的形式存在。针对传统数据挖掘对流数据孤立点挖掘应用中所遇到的问题,文中提出了一个基于改进的距离和密度的孤立点挖掘算法。实验证明,该算法能够有效地检测到流数据中的局部孤立点,从而捕捉到数据流上的概念漂移,能更好地应用于实际。  相似文献   

8.
基于警报序列聚类的多步攻击模式发现研究   总被引:1,自引:0,他引:1  
研究了从警报数据中发现多步攻击模式的方法。通过定义警报间的相似度函数来构建攻击活动序列集。采用序列比对技术,将具有相似攻击行为的序列进行聚类。基于动态规划的思想,通过抽取最长公共子序列的算法自动发现类中的多步攻击模式。该方法不需要依赖大量先验知识,设置参数少,易于实现。实验结果验证了该方法的有效性。  相似文献   

9.
周冬  苏勇  黄烨 《信息技术》2013,(3):168-171
传统异常检测技术是基于距离和密度的,快速的异常检测算法过分依赖于索引结构或网格划分,在低维数据上有很好的效果;面对高维数据的稀疏性、空空间现象等特性,索引结构失效,网格划分的数目呈指数级增长,传统算法性能下降;文中采用信息熵确定高维数据异常子空间,在异常子空间上使用DBSCAN聚类算法,在高维数据异常检测中表现出较好的性能。  相似文献   

10.
杨峰  刘胜强 《电子设计工程》2022,30(3):113-116,121
针对传统聚类算法对于大数据背景下大量电力大数据异常监测过程中存在的问题,提出在电力大数据异常值检测中的快速密度峰值聚类算法的改进.对传统基于密度峰值空间聚类方法进行分析,得到传统算法在使用过程中的问题.提出了快速密度峰值聚类算法的改进,对自适应参数与聚类中心自动的选择,通过标准化局部密度与距离对大数据异常值进行评测,能...  相似文献   

11.
聚类的根本在于对数据的划分与集合,数据可通过聚类算法对象的相似性与不同合集中对象的区别性来进行数据记录.近年来,由于数据库的信息量大量增长,在面对大规模数据集时,聚类分析的算法形式已经无法满足高内存,高CPU的时间限制,传统的数据算法正面临着"不高效"的严峻问题.本文旨在根据大规模数据集的背景,进一步分析聚类算法的优缺性,并针对其问题研究聚类新算法的设计方法.  相似文献   

12.
针对传统K-Means聚类算法的不足,提出一种新的对孤立点不敏感的K-Means聚类算法。首先,采用孤立点移除算法消除数据集中存在的孤立点;然后,对不包含孤立点的数据集进行传统K-Means聚类,再引入轮廓系数并选择轮廓系数最大值对应的簇类数作为数据集中簇的最优选择数目K;最后,通过自定义的聚类有效性评价函数评估聚类效果。实验结果表明,相对于传统K-Means聚类算法,对孤立点不敏感的新的K-Means聚类算法能够消除孤立点对数据集整体的影响,并优化了聚类中心的选择。  相似文献   

13.
聚类的(α,κ)-匿名数据发布   总被引:1,自引:0,他引:1       下载免费PDF全文
为更好的抵御背景知识攻击和同质攻击,保护特定的敏感值或全部敏感值,定义了单敏感值(α,κ)-匿名模型和多敏感值(α,κ)-匿名模型,并分别设计了两个聚类算法予以实现,同时分析了算法的正确性和复杂性.对于即包含连续属性又包含分类属性的数据集,给出了数据集的详细映射与处理方法,使数据集中点的距离可以方便的计算,彻底避免了把数据点距离和信息损失混淆的情况.详细的理论分析和大量的实验评估表明算法有较小的信息损失和较快的执行时间.  相似文献   

14.
聚类的(α,κ)-匿名数据发布   总被引:4,自引:0,他引:4       下载免费PDF全文
杨高明  杨静  张健沛 《电子学报》2011,39(8):1941-1946
为更好的抵御背景知识攻击和同质攻击,保护特定的敏感值或全部敏感值,定义了单敏感值(α,κ)-匿名模型和多敏感值(α,κ)-匿名模型,并分别设计了两个聚类算法予以实现,同时分析了算法的正确性和复杂性.对于即包含连续属性又包含分类属性的数据集,给出了数据集的详细映射与处理方法,使数据集中点的距离可以方便的计算,彻底避免了把...  相似文献   

15.
基于DBSCAN聚类算法的异常轨迹检测   总被引:4,自引:0,他引:4       下载免费PDF全文
周培培  丁庆海  罗海波  侯幸林 《红外与激光工程》2017,46(5):528001-0528001(8)
现有的异常轨迹检测算法往往侧重于检测轨迹的空域异常,忽略了对轨迹时域异常的检测,并且检测精确度不高,针对此类问题,提出了基于增强聚类的异常轨迹检测算法。首先,采用基于速度的最小描述长度(VMDL)准则把轨迹简化成有序线段;然后,使用改进的线段间的距离定义,基于DBSCAN算法把线段分为不同的类,以建模局部正常运动模式;最后,采用先检测空间异常性再检测时间异常性的二级检测算法,检测时空异常轨迹点。在多个测试集上的实验结果表明:该算法可以检测位置、角度、速度等三种时空异常轨迹点,相对于其他算法,明显提高了异常轨迹检测的精确度。  相似文献   

16.
针对传统网格聚类算法仅能够去除空网格的问题,提出一种基于图像分割思想来剔除稀疏数据的多密度网格聚类算法.该算法对原始数据进行网格划分和数据映射,计算网格密度,将每个网格看作图像中的一个像素点,采用Otsu算法确定合适阈值,并给出了阈值应用于网格聚类算法时的阈值折合公式,完成稀疏单元的剔除.在聚类过程中考虑到网格单元内部特征,通过两个网格的相对密度及边界特征得到了相邻网格的相似度度量公式,弥补了网格聚类算法无法应对多密度数据的缺点.在Matlab中进行仿真实验,该算法在聚类之前对网格剔除率为69%,且不需要人工干预,而GAMD和SNN算法未剔除网格.当数据维度增加时,GAMD算法时间远远高于本算法.实验证明,该算法具有较好的数据过滤效果,聚类结果与数据输入顺序无关,在得到任意簇的同时,保证了较高的时间效率且能够广泛应用于各种数据集.  相似文献   

17.
基于观测值聚类的多雷达数据融合   总被引:4,自引:0,他引:4  
采用一种改进的K NN算法对多雷达观测数据进行聚类 ,结合聚类中心和目标预测值 ,应用卡尔曼滤波器估计目标状态 ,从而实现多雷达数据融合。实验结果表明这种方法是有效的。  相似文献   

18.
基于数据加权策略的模糊聚类改进算法   总被引:2,自引:0,他引:2  
该文提出了一种数据指数加权的模糊均值聚类策略,引入了指数权因子和影响指数,使得可以在聚类过程中差异化处理各个数据。新策略和现有的Gustafson-Kessel(G-K)算法相结合,提出了一种新的模糊聚类算法DWG-K用于提高聚类质量和挖掘离群点。数据试验表明DWG-K在提高聚类质量方面优于现有的G-K;在离群点挖掘方面,DWG-K对离群点的判定是全局的,离群点的物理意义清楚,且计算效率明显高于当前广泛采用的基于密度的离群点挖掘算法。  相似文献   

19.
姜春茂  赵书宝 《电子学报》2021,49(8):1524-1532
聚类集成旨在通过融合多个不同的基聚类结果得到一个统一的类簇划分.针对现实环境中的模糊和不确定性数据,本文提出了一种基于阴影集的多粒度三支聚类集成算法.算法首先使用FCM聚类产生一组有差异性的基聚类成员,并通过阴影集构造三支聚类.然后引入多粒度粗糙集构建了四个近似集合,将每一个类簇划分为一个核心域和三个边界域.最后对边界...  相似文献   

20.
基于改进CURE聚类算法的无监督异常检测方法   总被引:4,自引:0,他引:4  
提出了一种基于改进的CURE聚类算法的无监督异常检测方法.在保证原有CURE聚类算法性能不变的条件下,通过对其进行合理的改进获得更加理想的簇,也为建立正常行为模型提供了更加纯净的正常行为数据.在建模过程中,提出了一种新的基于超矩形的正常行为建模算法,该算法有助于迅速、准确地检测出入侵行为.实验采用KDDcup99数据,实验结果表明该方法能够有效地检测网络数据中的已知和未知入侵行为.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号