共查询到20条相似文献,搜索用时 93 毫秒
1.
为了将频繁产生的分布在世界各地的金融数据按需地高性能集成,提出了基于ETL(extract-transform-load)的金融数据集成过程模型.对规则引擎原理进行了研究,建立了基于业务转换规则的插件式扩展实现可复用可定制的业务转换过程.利用事件驱动的交互模型和元数据映射保证非结构化和半结构化数据之间无差异集成,采用增量式数据处理解决数据集成中棘手的性能问题.通过实践项目的验证,对比传统数据集成方法和该过程模型,验证了该过程模型的有效性. 相似文献
2.
针对目前校园由于缺乏统一的数据规划导致各应用系统数据标准不一致,难以共享使用,出现了一个个的"信息孤岛"的现象,ETL通过建立底层数据交换平台来联系各个异构系统、应用、数据源,实现无缝共享和交换数据的需要。 相似文献
3.
针对目前校园由于缺乏统一的数据规划导致各应用系统数据标准不一致,难以共享使用,出现了一个个的“信息孤岛”的现象,ETL通过建立底层数据交换平台来联系各个异构系统、应用、数据源,实现无缝共享和交换数据的需要。 相似文献
4.
数据仓库中ETL技术的研究 总被引:43,自引:0,他引:43
作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。 相似文献
5.
6.
7.
数据仓库中ETL技术的探讨与实践 总被引:9,自引:0,他引:9
支持数据抽取、转换、清洗和装载的工具集对任何数据仓库工程都是一个必不可少的关键部件。本文重点探讨了ETL技术以及ETL工具的选择原则,并结合具体实例详细介绍了ETL过程的设计和实现方法。 相似文献
8.
面向数据质量的ETL框架的设计与实现 总被引:1,自引:0,他引:1
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构.根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等.该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理.基于该设计思想开发一个ETL工具-DQETL.DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理.最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤. 相似文献
9.
10.
11.
何雪利 《数字社区&智能家居》2010,(8)
学校各部门的业务系统在发挥重要作用的同时,由于各个系统之间拥有各自的数据存储与访问方式,彼此独立,形成了一个个信息孤岛。该文结合我院数字化校园建设过程中的具体实践,通过对数据集成技术的研究,选择合理的数据集成方案,解决了各部门业务系统之间的数据互通问题,保障了数据的权威性、唯一性、完整性和准确性,创造出一个良好的数据环境。 相似文献
12.
13.
改进传统ETL数据抽取工具的技术复杂,抽取效率低等方面不足,设计实现了一种新的数据抽取工具——JMELT抽取工具,并简单介绍了JMELT工具的关键技术及其功能实现,并对工具的有效性作了验证。 相似文献
14.
信息系统中的通用数据迁移工具的研究与设计 总被引:1,自引:0,他引:1
数据迁移是信息系统在升级时常遇到的问题,本文重点介绍了使用Java与XML实现异构数据库间的数据迁移,解决数据转换过程中的数据异构性。数据迁移分为数据抽取、数据转换与数据载入三个过程。同时引入XML技术实现了抽取和转换规则的定义,使得数据迁移具备良好的通用性和可扩展性。 相似文献
15.
郭杨 《数字社区&智能家居》2011,(21):5045-5046
异构数据库间的数据交互日益频繁,可扩展标记语言逐步展现了其在数据存储、数据交换等领域的显著优势,迅速成为数据格式标准.该文阐明了一种基于XML的异构数据交换方法,描述了关系型数据库关系模式到XML Schema模式的转换方法,并建立了数据转换的公共数据模型. 相似文献
16.
李芸 《数字社区&智能家居》2014,(12):8081-8082
大数据不仅意味着大机遇,同样带来了大噪声。因此,任何具有价值的大数据策略都必须给出滤除噪音,同时对真正相关的数据进行有效且高效的处理和解决办法。该文分析了大数据背景下企业的数据策略和现有IT解决方案中存在的问题,提出通过优化ETL过程来增强早期数据整合的解决方案,以提高企业大数据策略的成本收益。 相似文献
17.
18.
基于数据仓库的ETL过程优化 总被引:2,自引:0,他引:2
彭璐 《计算机与数字工程》2010,38(5):166-169
提出一种优化ETL整体过程的方法,包括:其一,针对现有ETL过程的局限性提出一个优化其整体流程的框架EICLF(Extracting/Integrating/Cleaning/Loading/Feedback)流程;其二,对现有相似重复记录的识别算法进行改进;其三,根据清理后得到的干净数据对源数据进行反馈处理。 相似文献
19.
20.
ETL (Extract-Transform-Load) usually includes three phases: extraction, transformation, and loading. In building data warehouse, it plays the role of data injection and is the most time-consuming activ... 相似文献