首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于总线模型的数据清洗方法
引用本文:杨梦宁,赵鹏,张小洪,李朋.一种基于总线模型的数据清洗方法[J].计算机科学,2010,37(4):224.
作者姓名:杨梦宁  赵鹏  张小洪  李朋
作者单位:重庆大学软件学院,重庆,400044
基金项目:国家自然科学基金(60975015);;重庆市科委科技攻关计划项目(2009AC2057);;重庆市科委自然科学基金(2009BB2364);;重庆大学青年骨干教师创新能力培育基金资助
摘    要:数据清洗是保证数据质量的重要环节。已有的清洗方法往往过于依赖特定应用,不容易得到重用。从提高数据清洗方法的可重用性和可扩展性的角度出发,提出一种基于总线模型可复用的数据清洗框架。具有相对独立功能的清洗工具以组件的形式,通过适配器挂接到清洗总线上,通过总线控制对清洗组件实现清洗。最后用具体应用来描述基于总线模型的数据清洗方法的工作流程。实践结果证明该方法具有良好的性能和应用价值。

关 键 词:数据清洗  总线模型  组件  可复用  
收稿时间:2009/10/20 0:00:00
修稿时间:2009/11/23 0:00:00

Data Clean Method Based on Bus Model
YANG Meng-ning,ZHAO Peng,ZHANG Xiao-hong,LI Peng.Data Clean Method Based on Bus Model[J].Computer Science,2010,37(4):224.
Authors:YANG Meng-ning  ZHAO Peng  ZHANG Xiao-hong  LI Peng
Affiliation:School of Software Engineering/a>;Chongqing University/a>;Chongqing 400044/a>;China
Abstract:Data cleansing is an important part for ensuring data quality.The existing cleaning methods are often too dependent on a specific application,can not be reused.In order to improve the reusability and scalability of the clean method,a data clean framework was build which is based on bus model and reusable.The data clean tool which has indepen-dent clean function is registered on the bus through the adapter.The clean function is finished by calling the clean components which is registered on the bus.Finally,h...
Keywords:Data clean  Bus model  Component  Reusable  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号