首页 | 官方网站   微博 | 高级检索  
     

数据仓库环境下以用户为中心的数据清洗过程模型
引用本文:鲍玉斌,孙焕良,冷芳玲,王大玲,于戈.数据仓库环境下以用户为中心的数据清洗过程模型[J].计算机科学,2004,31(5):52-55.
作者姓名:鲍玉斌  孙焕良  冷芳玲  王大玲  于戈
作者单位:东北大学信息学院,沈阳,110004
基金项目:国家自然科学基金项目资助(项目编号:60173051)
摘    要:数据清洗是数据仓库和数据挖掘中非常重要的一个环节。本文首先分析总结了数据清洗的有关概念,给出了数据清洗中需要解决的质量问题,并总结了解决这些问题的技术和方法。在此基础上提出了以人为中心的数据清洗过程模型。该模型集成了工作流技术、数据集成、数据转换和数据挖掘技术。给出了每个工具箱应该提供的基本功能。

关 键 词:数据仓库  用户  数据清洗  数据挖掘  质量问题  工作流技术  数据集成  数据转换

A Human-Centered Process Model for Data Cleansing under Data Warehousing
BAO Yu-Bin SUN Huan-Liang LENG Fang-Ling WANG Da-Ling YU Ge.A Human-Centered Process Model for Data Cleansing under Data Warehousing[J].Computer Science,2004,31(5):52-55.
Authors:BAO Yu-Bin SUN Huan-Liang LENG Fang-Ling WANG Da-Ling YU Ge
Abstract:Data cleansing is an important step both in data warehousing and data mining. This paper reviews some concepts on data cleansing, lists the data quality issues needed to be resolved in data cleansing process, and presents the techniques and methods for data cleansing firstly. Then a human-centered process model for data cleansing is proposed. It combines with workflow, data integration, data transformation, and data mining techniques. It also presents the main functions of each toolkits.
Keywords:Data cleansing  Process model  Data warehousing  Data mining  Data quality  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号