基于数据质量控制的ETL |
| |
作者姓名: | 孙水华 刘建华 林志强 |
| |
作者单位: | 福建工程学院计算机与信息科学系,福建福州350108 |
| |
基金项目: | 福建工程学院科研基金资助项目(GY-Z09072) |
| |
摘 要: | 提出了一种基于数据质量进行控制的ETL技术,在传统的ETL操作流程中增加脏数据处理模块及抽样数据质量评估模块,并将数据质量控制思想融入到ETL的操作流程设计中,控制ETL过程的数据质量。实验表明,带有质量控制的ETL算法设计优化了ETL工作流程,提高了进入数据挖掘中数据的质量。
|
关 键 词: | ETL过程 脏数据处理 数据预处理 数据质量评估 |
本文献已被 维普 等数据库收录! |
|