首页 | 本学科首页   官方微博 | 高级检索  
     

基于距离的数据流离群点挖掘算法
作者姓名:杨显飞  张健沛  杨静  初妍
作者单位:1. 哈尔滨工程大学2. 哈尔滨工程大学计算机科学与技术学院3.
摘    要:传统的离群点挖掘算法无法有效挖掘数据流中的离群点。针对数据流的无限输入和动态变化等特点,提出一种新的基于距离的数据流离群点挖掘算法。通过Hoeffding定理及独立同分布中心极限定理,对数据流概率分布变化进行动态检测,利用检测结果自适应调整滑动窗口大小对数据流离群点进行挖掘。实验结果表明,该算法在人工数据集和真实数据集KDD-CUP99中可以对数据流中的离群点进行有效挖掘。

关 键 词:数据流  离群点  Hoeffding定理  滑动窗口  
收稿时间:2010-05-05
修稿时间:2010-07-07
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号