首页 | 本学科首页   官方微博 | 高级检索  
     

非结构化数据的ETL设计
引用本文:曹金山,张泽滨.非结构化数据的ETL设计[J].现代电子技术,2011,34(10):48-50.
作者姓名:曹金山  张泽滨
作者单位:1. 长安大学信息工程学院,陕西西安,710064
2. 西安交通大学能源与动力工程学院,陕西西安,710049
摘    要:为了实现非结构化数据的ETL处理,分析了数据整合的发展现状和业务需求,描述了目前国际流行的公共仓库元模型(CWM)以及在ETL实现中的作用,详细分析了结构化数据和非结构化数据的不同特点。针对两种数据的差异,提出了解决非结构化数据的属性提取和数据打包的方法,为非结构化数据形成元数据奠定了基础,从而实现了非结构化数据的ETL设计,设计完全满足标准的数据整合要求。

关 键 词:非结构化数据  结构化数据  CWM  ETL

ETL Design of Unstructured Data
CAO Jin-shan,ZHANG Ze-bin.ETL Design of Unstructured Data[J].Modern Electronic Technique,2011,34(10):48-50.
Authors:CAO Jin-shan  ZHANG Ze-bin
Affiliation:CAO Jin-shan1,ZHANG Ze-bin2(1.School of Information Engineering,Chang'an University,Xi'an 710064,China,2.School of Energy-dynamic Engineering,Xi'an Jiaotong University,Xi'an 710049,China)
Abstract:In order to realize ETL processing of unstructured data,the current situation and demands of data integration are analyzed.The popular CWM model and its application in ETL are described.The different features between structured data and unstructured data are analized to get the property of unstructured data.This work provides a foundation for meta-data of unstructured data,and meets the demands of unstructured data ETL and data integration.
Keywords:unstructured data  structured data  CWM  ETL  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号