首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于多重聚类的离群点检测算法
引用本文:古 平,刘海波,罗志恒. 一种基于多重聚类的离群点检测算法[J]. 计算机应用研究, 2013, 30(3): 751-753
作者姓名:古 平  刘海波  罗志恒
作者单位:重庆大学 计算机学院,重庆,400044
基金项目:中央高校基本科研业务费科研专项基金资助项目(CDJZR 10180008)
摘    要:在LDOF算法的基础上,提出一种基于多重聚类的离群点检测算法PMLDOF。该算法针对局部离群度量计算量大的缺点,采用聚类剪枝技术作为减少计算量的方法;同时,为了避免将位于簇边缘的离群点错剪,算法利用多重聚类的差异性对簇的边缘点进行筛选。在对数据集进行剪枝后,计算剩余数据的局部离群度LDOF,并找出符合条件的离群数据点。实验结果表明,算法在时间复杂度和检测精度上具有更好的优越性。

关 键 词:数据挖掘  离群检测  剪枝  多重聚类  局部离群度

Multi-clustering based outlier detect algorithm
GU Ping,LIU Hai-bo,LUO Zhi-heng. Multi-clustering based outlier detect algorithm[J]. Application Research of Computers, 2013, 30(3): 751-753
Authors:GU Ping  LIU Hai-bo  LUO Zhi-heng
Affiliation:College of Computer Science, Chongqing University, Chongqing 400044, China
Abstract:Based on the LDOF algorithm, this paper proposed a multi-clustering based outlier detection algorithm PMLDOF. To reduce the amount of calculation for local outlier factor, it employed cluster pruning technique. The other improvement was to filter the non-outliers based on the difference of multiple clustering, which was to avoid the error pruning of outliers located at the edge of clusters. After pruning, it calculated the local outlier factors of remaining data and obtained the outliers. Experimental results show PMLDOF is superior to LDOF algorithm not only in the efficiency but also in the detection accuracy.
Keywords:data mining   outlier detection   pruning   muti-clustering   local outlier degree
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号