首页 | 本学科首页   官方微博 | 高级检索  
     

数据清理综述
引用本文:杨辅祥,刘云超,段智华. 数据清理综述[J]. 计算机应用研究, 2002, 19(3): 3-5
作者姓名:杨辅祥  刘云超  段智华
作者单位:上海大学,计算机系,上海,200072
摘    要:由于各种原因 ,数据中存在这样或那样的脏数据需要清理 (净化 )。特别是数据仓库、KDD及TDQM(综合数据质量管理 )中 ,必须对数据进行清理。介绍了数据清理的有关内容、技术与实现方案 ,着重介绍了目前的两个重点研究、应用内容 :异常发现与记录重复

关 键 词:数据清理  数据质量  异常  记录重复
文章编号:1001-3695(2002)03-0003-03
修稿时间:2001-04-27

An Overview of Data Cleaning
YANG Fu xiang,LIU Yun chao,DUAN Zhi hua. An Overview of Data Cleaning[J]. Application Research of Computers, 2002, 19(3): 3-5
Authors:YANG Fu xiang  LIU Yun chao  DUAN Zhi hua
Abstract:A lot of data is dirty because of some reasons.It is required and crucial to cleaning these data when we mainly depend on them. Data cleaning is a major part of data warehousing,KDD,TDQM(total data quality management). We provide an overview of data cleaning including its content,technology and realization. And we also introduce two main application: detecting outlier and duplicate elimination.
Keywords:Data Cleaning  Data Quality  Outlier  Duplicate Elimination
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号