首页 | 本学科首页   官方微博 | 高级检索  
     

基于规则引擎的数据清洗
引用本文:叶舟,王东. 基于规则引擎的数据清洗[J]. 计算机工程, 2006, 32(23): 52-54
作者姓名:叶舟  王东
作者单位:上海交通大学软件学院,上海,200030;上海交通大学软件学院,上海,200030
摘    要:以往的数据清洗研究存在以下缺陷:检测和修复动作要么使用灵活性差的硬编码,要么依靠灵活却低效的人工判断。该文提出了一个使用规则来描述清洗逻辑,使用规则引擎来执行清洗逻辑,从而能够处理各种数据质量问题的数据清洗架构REBDCA,解决了该问题。展示了REBDCA和一个ETL工具的集成,测试了REBDCA的性能,并和用硬编码完成相同逻辑的方案进行了性能对比。

关 键 词:规则引擎  数据清洗  抽取-转换-装载
文章编号:1000-3428(2006)23-0052-03
收稿时间:2006-02-28
修稿时间:2006-02-28

Rules Engine Based Data Cleansing
YE Zhou,WANG Dong. Rules Engine Based Data Cleansing[J]. Computer Engineering, 2006, 32(23): 52-54
Authors:YE Zhou  WANG Dong
Affiliation:School of Software, Shanghai Jiaotong University, Shanghai 200030
Abstract:Previous researches on data cleansing use inflexible hardcode or inefficient manual work to detect and repair data quality problems.This paper presents a rules engine based data cleansing architecture(REBDCA) to solve this problem.REBDCA uses rules to describe data cleansing logic and then uses rules engine to excute it.An integration of REBDCA and ETL tool is presented as an example,and its performance is measured.
Keywords:Rules engine  Data cleansing  Extraction-transformation-loading(ETL)  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号