首页 | 本学科首页   官方微博 | 高级检索  
     

基于矢量量化码书的离群点检测方法*
引用本文:胡云,李存华,孙志挥.基于矢量量化码书的离群点检测方法*[J].计算机应用研究,2008,25(8):2322-2324.
作者姓名:胡云  李存华  孙志挥
作者单位:1. 淮海工学院,计算机科学系,江苏,连云港,222005
2. 东南大学,计算机科学与工程学院,南京,210018
基金项目:2007.国家自然科学基金资助项目(70371015); 国家教育部高等学校博士学科点专项科研基金资助项目(20040286009); 江苏省教育厅自然科学基金资助项目(06KJB520005)
摘    要:利用矢量量化码书作为数据分类模式最优代表集的特点,提出基于码书的离群点概念,论证了其与经典统计学关于离群点定义的内在联系。在基于学习的矢量量化码书生成算法和最近邻码字搜索算法基础上构造了离群点检测算法。实验结果表明了提出的关于离群点定义的合理性和算法的有效性。

关 键 词:矢量量化    码书    离群点检测算法

Vector quantization approach to outlier detection
HU Yun,LI Cun hu,SUN Zhi hui.Vector quantization approach to outlier detection[J].Application Research of Computers,2008,25(8):2322-2324.
Authors:HU Yun  LI Cun hu  SUN Zhi hui
Affiliation:HU Yun1,LI Cun-hua1,SUN Zhi-hui2
Abstract:In vector quantization,the codebook is chosen so as to best represent the distributional structure of the dataset of vectors.This characteristic of codebook is suitable for the purpose of outlier detection.This paper defined the concept codebook-based outlier followed by a dedicated analysis of its relation with the definition from statistical discipline.With this definition,the outliers could be found with a two-phase algorithm.Experiments on real world dataset show that this novel approach is quiet promising both on its rationality and effectivity.
Keywords:vector quantization  codebook  outlier detection algorithm
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号