首页 | 本学科首页   官方微博 | 高级检索  
     

度量空间中基于距离孤立点的快速挖掘
引用本文:邵纪东,荣冈,顾海杰.度量空间中基于距离孤立点的快速挖掘[J].浙江大学学报(自然科学版 ),2009,43(2):297-302.
作者姓名:邵纪东  荣冈  顾海杰
作者单位:浙江大学 工业控制技术国家重点实验室,浙江 杭州 310027
基金项目:国家高技术研究发展计划(863计划) 
摘    要:将数据点的k最近邻(k-NN)距离作为孤立程度指标能够有效地发现数据集中的孤立点,但是基本算法需要O(N2)次数据点间的距离计算,不适用于大数据集.为此提出了一种利用度量空间中三角不等式的快速挖掘算法--提前修剪(ADVP).ADVP利用每次k-NN查询中保存的近邻点到被查询点的距离计算出近邻点的孤立程度上界.孤立程度上界小于已发现最弱孤立点的孤立程度的数据点可被修剪而无须进行k-NN查询.基于抽样方法优化了搜索次序以提高修剪效果.同时将ADVP自然地扩展为增量式算法.在标准大数据集上的实验结果表明,ADVP和现有算法相比明显节省了计算开销,具有更好的伸缩性;增量式ADVP能够有效地处理新增数据.

关 键 词:基于距离的孤立点  度量空间    klang="EN-US">k  style="font-family:  -宋体">-  NNlang="EN-US">NN  style="font-family:  查询" target="_blank">宋体">查询  增量式挖掘  伸缩性  " target="_blank">lang="EN-US">

Fast mining of distance-based outliers in metric space
SHAO Ji-dong,RONG Gang,GU Hai-jie.Fast mining of distance-based outliers in metric space[J].Journal of Zhejiang University(Engineering Science),2009,43(2):297-302.
Authors:SHAO Ji-dong  RONG Gang  GU Hai-jie
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《浙江大学学报(自然科学版 )》浏览原始摘要信息
点击此处可从《浙江大学学报(自然科学版 )》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号