首页 | 本学科首页   官方微博 | 高级检索  
     

基于衰减模型的混合属性数据流离群检测
引用本文:苏晓坷,兰洋,秦玉明,程耀东. 基于衰减模型的混合属性数据流离群检测[J]. 计算机科学, 2010, 37(5): 157-162
作者姓名:苏晓坷  兰洋  秦玉明  程耀东
作者单位:1. 东华大学信息科学与技术学院,上海,201620
2. 信阳师范学院计算机与信息技术学院,信阳,464000
3. 中国科学院高能物理研究所计算中心,北京,100049
基金项目:国家863高技术研究发展计划(2006AA01A120);;国家自然科学基金(10871040)资助
摘    要:数据流离群检测因内存容量限制和实时检测需求而成为离群检测的一个难点。介绍了一种快速混合属性数据流离群检测算法。在衰减模型下增量聚类数据流,生成代表数据分布的聚类特征集合,半径阈值动态变化;当接收到检测请求时,计算满足条件的每个簇的离群因子,具有高离群因子的簇作为结果输出。同时提出了一种可有效区分离群簇与数据进化初始阶段的方法。算法的时间与空间复杂度同数据流规模近似成线性关系,在真实数据集上的实验结果显示,该算法可有效检测混合属性数据流中的离群点。

关 键 词:混合属性  数据流  增量聚类  离群检测  衰减模型  
收稿时间:2009-07-20
修稿时间:2009-09-13

Outlier Detection Based on the Damped Model in Mixed Data Streams
SIJ Xiao-ke,LAN Yang,QIN Yu-ming,CHENG Yao-dong. Outlier Detection Based on the Damped Model in Mixed Data Streams[J]. Computer Science, 2010, 37(5): 157-162
Authors:SIJ Xiao-ke  LAN Yang  QIN Yu-ming  CHENG Yao-dong
Affiliation:College of Information Science and Technology/a>;Donghua University/a>;Shanghai 201620/a>;China;School of Computer and Information Technology/a>;Xinyang Normal University/a>;Xinyang 464000/a>;China;Institute of High Energy Physics/a>;Chinese Academy of Sciences/a>;Beijing 100049/a>;China
Abstract:Outlier detection in data streams poses great challenges due to the limited memory availability and real time detection requirement.A fast outlier detection algorithm in mixed data streams was introduced by clustering the data streams incrementally based on the damped model and generating the cluster features on behalf of the data distribution.The radius threshold value changed dynamically.When detection requirement was received the outlier factor of specified clusters was calculated and the clusters with h...
Keywords:Mixed attribute  Data streams  Incremental clustering  Outlier detection  Damped model  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号