首页 | 本学科首页   官方微博 | 高级检索  
     

基于网格和密度的海量数据增量式离群点挖掘算法
引用本文:张净,孙志挥,杨明,倪巍伟,杨宜东.基于网格和密度的海量数据增量式离群点挖掘算法[J].计算机研究与发展,2011,48(5).
作者姓名:张净  孙志挥  杨明  倪巍伟  杨宜东
作者单位:1. 东南大学计算机科学与工程系,南京,210096;江苏大学电气信息工程学院,江苏镇江,212001
2. 东南大学计算机科学与工程系,南京,210096
3. 南京师范大学计算机科学与技术学院,南京,210097
摘    要:处理海量和高维数据已经成为设计离群点算法面临的重要任务和挑战,针对海量数据的特点提出一种基于网格和密度的增量式离群点挖掘算法IGDLOF,算法的基本思想为:采用网格的七元组信息减少数据维数和数量,利用增量更新减少内存需求.通过代表点过滤相应的主体数据,先判断再进行近似密度计算的方法减少计算量,降低算法的复杂度.通过在真实和仿真数据集的测试表明,IGDLOF增量算法可与LOF算法保持相同的精确度,而执行效率得到显著的提高.

关 键 词:海量数据  网格  密度  离群点挖掘  增量  LOF算法

Fast Incremental Outlier Mining Algorithm Based on Grid and Capacity
Zhang Jing,Sun Zhihui,Yang Ming,Ni Weiwei,Yang Yidong.Fast Incremental Outlier Mining Algorithm Based on Grid and Capacity[J].Journal of Computer Research and Development,2011,48(5).
Authors:Zhang Jing  Sun Zhihui  Yang Ming  Ni Weiwei  Yang Yidong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号