首页 | 本学科首页   官方微博 | 高级检索  
     

基于孤立点检测的错误数据清理方法
引用本文:陈伟,王昊,朱文明. 基于孤立点检测的错误数据清理方法[J]. 计算机应用研究, 2005, 22(11): 71-73
作者姓名:陈伟  王昊  朱文明
作者单位:(南京审计学院, 江苏 南京 210029)
基金项目:国家自然科学基金资助项目(70371015)
摘    要:针对数据源中出现的错误数据,分析了孤立点检测方法在数据清理中的重要性,提出了一种基于孤立点检测的错误数据清理方法。在对常用孤立点检测方法进行比较、分析的基础上,采用一种有效的孤立点检测方法来检测数据源中的孤立点。最后,以一个实例验证了该方法的效果。研究表明:基于孤立点检测的错误数据清理方法能有效地检测数据源中的错误数据。

关 键 词:数据挖掘  数据清理  错误数据  孤立点检测
文章编号:1001-3695(2005)11-0071-03
收稿时间:2004-10-22
修稿时间:2005-06-26

Cleaning Method of Incorrectness Data Based on Outlier Detection
CHEN Wei,WANG Hao,ZHU Wen-ming. Cleaning Method of Incorrectness Data Based on Outlier Detection[J]. Application Research of Computers, 2005, 22(11): 71-73
Authors:CHEN Wei  WANG Hao  ZHU Wen-ming
Affiliation:(Nanjing Audit Institute, Nanjing Jiangsu 210029, China)
Abstract:Aiming at incorrectness data appeared in data source,the importance of outlier detection method in data cleaning is analyzed, and an incorrectness data cleaning method based on outlier detection is proposed. Based on analyzing the common outlier detection method, an effective outlier detection method is used to detect the outliers in data source. Finally, the validity of this method is proved by an example. Research result shows that incorrectness data cleaning method based on outlier detection can detect incorrectness data of data source effectively.
Keywords:Data Mining   Data Cleaning   Incorrectness Data   Outlier Detection
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号