首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于分布式数据仓库的文件集快速更新算法
引用本文:于宝琴,王太勇,何改云,李国琴,王双利.一种基于分布式数据仓库的文件集快速更新算法[J].制造业自动化,2005,27(10):13-16.
作者姓名:于宝琴  王太勇  何改云  李国琴  王双利
作者单位:1. 天津大学,机械工程学院,天津,300072;天津财经大学,商学院,天津,300222
2. 天津大学,机械工程学院,天津,300072
基金项目:国家自然科学基金资助(50475117);天津科技发展计划重大攻关目(033181611)(0431835116)
摘    要:异构数据源整合是企业数据共享的前提,而高效的数据更新不仅节约系统开销还能提供实时数据。在分布式数据仓库的数据预处理区快速更新变动的数据是一个非常重要的热点问题,利用增量文件集的快速更新算法进行ETL设计可以加快数据更新的速度,消除异构数据模式的不一致和语义冲突问题,成套电器集团公司的成功应用证明了该算法的有效性。

关 键 词:分布式数据仓库  cliff-matoh算法  增量更新  文件集  ETL
文章编号:1009-0134(2005)10-0013-04
收稿时间:2005-04-26
修稿时间:2005年4月26日

A fast refreshment algorithm for filesets based on distributed data warehouse
YU Bao-qin,WANG Tai-yong,HE Gai-yun,LI Guo-qin,WANG Shuang-li.A fast refreshment algorithm for filesets based on distributed data warehouse[J].Manufacturing Automation,2005,27(10):13-16.
Authors:YU Bao-qin  WANG Tai-yong  HE Gai-yun  LI Guo-qin  WANG Shuang-li
Affiliation:1. School of Mechanical Engineering, Tianjin University, Tianjin 300072, China; 2. Department of Information, Tianjin University of Finance and Economics, Tianjin 300222, China
Abstract:Integrating heterogeneous data source is a precondition to share for enterprise data, but highly-efficient data updating is not only economical in saving system expenses, but also available in offering real- time datum. Data change at a faster speed in distributed Data Warehouse is one of the very important hot issues. Developing the ETL design by utilizing fast algorithm of increment filesets can accelerate the speed of data change, and delete heterogeneous data between nonconformity and semanteme conflict, it proves the validity of algorithm by the successful application with the corporation working on sets of electric apparatus.
Keywords:distributed data warehouse  diff-match algorithm  incremental refreshment  fileset  ETL
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号