首页 | 本学科首页   官方微博 | 高级检索  
     

NLOF:一种新的基于密度的局部离群点检测算法
引用本文:王敬华,赵新想,张国燕,刘建银.NLOF:一种新的基于密度的局部离群点检测算法[J].计算机科学,2013,40(8):181-185.
作者姓名:王敬华  赵新想  张国燕  刘建银
作者单位:华中师范大学计算机学院 武汉430079;华中师范大学计算机学院 武汉430079;华中师范大学计算机学院 武汉430079;华中师范大学计算机学院 武汉430079
基金项目:本文受国家自然科学基金项目(61170017)资助
摘    要:基于密度的局部离群点检测算法(LOF)的时间复杂度较高且不适用于大规模数据集和高维数据集的离群点检测。通过对LOF算法的分析,提出了一种新的局部离群点检测算法NLOF,该算法的主要思想如下:在数据对象邻域查询过程中,尽可能地利用已知信息优化邻近对象的邻域查询操作,有关邻域的计算查找都采用这种思想。首先通过聚类算法DBSCAN对数据集进行预处理,得到初步的异常数据集。然后利用LOF算法中计算局部异常因子的方法计算初步异常数据集中对象的局部异常程度。在计算数据对象的局部异常因子的过程中,引入去一划分信息熵增量,用去一划分信息熵差确定属性的权重,対属性的权值做具体的量化,在计算各对象之间的距离时采用加权距离。 在真实数据集上 对NLOF算法进行了充分的验证。结果显示,该算法能够提高离群点检测的精度,降低时间复杂度,实现有效的局部离群点的检测。

关 键 词:数据挖掘  离群点检测  信息熵  聚类
收稿时间:2012/12/30 0:00:00
修稿时间:2013/3/11 0:00:00

NLOF:A New Density-based Local Outlier Detecting Algorithm
WANG Jing-hu,ZHAO Xin-xiang,ZHANG Guo-yan and LIU Jian-yin.NLOF:A New Density-based Local Outlier Detecting Algorithm[J].Computer Science,2013,40(8):181-185.
Authors:WANG Jing-hu  ZHAO Xin-xiang  ZHANG Guo-yan and LIU Jian-yin
Affiliation:Academy of Computer Science,Central China Normal University,Wuhan 430079,China;Academy of Computer Science,Central China Normal University,Wuhan 430079,China;Academy of Computer Science,Central China Normal University,Wuhan 430079,China;Academy of Computer Science,Central China Normal University,Wuhan 430079,China
Abstract:
Keywords:Data mining  Outlier detection  Information entropy  Clustering
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号