首页 | 官方网站   微博 | 高级检索  
     

数据质量研究综述
引用本文:韩京宇,徐立臻,董逸生.数据质量研究综述[J].计算机科学,2008,35(2):1-5.
作者姓名:韩京宇  徐立臻  董逸生
作者单位:1. 中科院软件所基础软件国家工程中心,北京,100080
2. 东南大学计算机科学与工程系,南京,210096
基金项目:江苏省高技术研究发展计划项目
摘    要:数据质量管理是信息系统建设的首要问题.本文首先回顾了数据质量的定义和质量提高策略的分类,然后对数据质量研究涉及的两个主要方面,即数据质量评估和数据质量提高技术的各种方法进行了比较和分析,并对有代表性的数据质量提高工具进行了介绍.最后提出了一个评估驱动的数据质量提高框架,并对数据质量研究方向进行了展望.

关 键 词:数据质量  数据清洗  机器学习  数据审计

An Overview of Data Quality Research
HAN Jing-Yu,XU Li-Zhen,DONG Yi-Sheng.An Overview of Data Quality Research[J].Computer Science,2008,35(2):1-5.
Authors:HAN Jing-Yu  XU Li-Zhen  DONG Yi-Sheng
Abstract:Data quality management is an essential problem for information systems.First,the definitions of data quality are overviewed and the strategies for improving quality are summarized.Then,the two main aspects of data quality research,that is data quality assessment and data quality improvement methods are analyzed respectively.At last,some data quality tools are briefly touched on.Based on above analysis,an assessment-driven data improvement framework is proposed and the future research directions are discussed.
Keywords:Data quality  Data cleansing  Machine learning  Data auditing
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号