共查询到19条相似文献,搜索用时 187 毫秒
1.
随着企业信息化的不断发展,石油单位将数据整合纳入到重点规划中。面对分散在各处的异构数据源进行数据整合并非易事,首先仅靠手工进行脏数据的清洗不但费时费力,质量也难以保证;其次,数据的定期更新也存在困难。ETL系统为数据整合提供了令人满意的解决方案。它可以完成数据抽取、清洗、转换、装载等任务,满足了用户对异构数据源进行整合的需求,也实现了数据的后期更新。笔者对钻井数据仓库ETL系统的设计提出了一种基于元数据的ETL体系结构,并重点设计了数据准备区、ETL管理模块、任务管理模块和元数据管理模块。该工具已在中海油田化学技术专家支持系统中得到应用。 相似文献
2.
3.
面向数据质量的ETL框架的设计与实现 总被引:1,自引:0,他引:1
针对传统抽取-转换-装载(ETL)架构在数据质量控制方面的不足,提出一种面向数据质量管理的ETL架构.根据ETL过程的特点,设计多数据源接口模块、ETL元数据描述模块、ETL任务描述模块和数据质量控制模块等.该架构以数据质量为核心,通过建立数据分析模型,利用规则推导引擎对数据分析结果生成数据清洗方案,从而有效地对数据流进行质量评估和管理.基于该设计思想开发一个ETL工具-DQETL.DQETL采用统一建模语言进行设计,并提供友好界面对ETL过程进行集中管理.最后,结合实例阐述了在该框架下进行数据质量管理的一般步骤. 相似文献
4.
5.
6.
7.
8.
白蓉 《自动化技术与应用》2021,40(1):44-47
本文针对大学生精准资助设计多源异构数据仓库系统.首先设计系统整体框架,其次设计系统开发流程,再次详细探究多源异构数据源与仓库建模,最后进行数据ETL与数据分析.此系统可为顺利访问高校学生精准资助相关数据提供统一平台,便于转换动态业务数据,实时综合查询数据、挖掘数据、多维分析数据,提高高校学生资助管理的决策效率与水平. 相似文献
9.
10.
ETL包含数据的抽取、转换、加载三个部分,是构建数据仓库的重要环节。为解决异构数据源集成问题,本文提出了基于元数据的数据交换系统,并在该基础上阐述了数据交换系统中的任务设计模型和任务调度模型。最后介绍了数据交换系统中的主要算法以及设计模式。 相似文献
11.
面向业务的数据集成系统设计与实现 总被引:1,自引:1,他引:0
在企业数据集成过程中,大多采用适配器实现异构数据源的访问,针对每个数据源开发一个特定的数据源适配器,存在开发难度大,开发周期长的问题。同时,由于各个业务系统数据的复杂性,导致数据集成系统的配置、部署复杂。自主研发的面向业务的数据集成系统,不仅解决了分布式环境下异构数据的集成,同时,使数据集成系统具有良好的扩展性及部署的简单性。介绍了系统的体系结构,给出了数据源适配器开发框架,提出了一种基于中间表的增量数据获取及发送方法,并结合某百货集团业务需求,给出了数据集成的方案。 相似文献
12.
13.
基于虚拟集中方法的异构分布式数据集成模型 总被引:15,自引:1,他引:14
网络和信息技术的发展导致新的数据格式不断涌现,数据整合的要求日益迫切,为此提出一个基于虚拟集中方法实现的异构数据集成模型,可以实现分布、异构数据的一致性访问,并能保证数据的一致性、实时性和数据源的“即插即用”,较好地解决了异构数据源的联合使用问题。最后给出了基于Java和XML技术的基本实现方法。 相似文献
14.
如何对来自多种异构数据源的信息进行方便、有效地集成是企业信息集成需要考虑的重点.随着"开放式网格服务基础架构"的研究和应用不断取得进展,为信息集成提供了新的解决思路和方法.在分析了分布异构环境下企业信息集成特点的基础上,提出了基于层次化服务框架的企业信息集成方法,该方法通过建立数据层面的集成层次,实现对传统及新兴的多种异构数据源的统一、实时访问,同时提供相应的信息转换能力,综合解决数据集成中的管理、性能、实时性和可用性等多方面问题,阐述了该方法在基于HAD的纺织销售集成平台中应用实现. 相似文献
15.
基于XML的数据模型在报表模块上的应用 总被引:5,自引:0,他引:5
该文针对商业报表工具和报表模块的不足,提出了一个新的报表模块框架,利用基于XML技术定义的数据模型,在报表功能模块与实际数据源之间建立了一个“中间层”。“中间层”的引入,降低了报表模块与实际数据源的耦合度,提高了报表模块的分析能力和可操作性,也为报表模块与其它应用系统之间实现应用集成和数据集成提供了便利。 相似文献
16.
提出了一种数据空间中的命名实体集成模型(NEIM)及其在异质异构数据源中的集成方法。命名实体模型描述了数据源、实体与实体描述间的关系,能够实现从其中任意一个息查询到其它相关信息。命名实体的集成架构指出了数据空间中命名实体集成要完成的主要任务,包括命名实体的识别、实体的集成映射和实体的统一。集成算法描述了数据空间中异构数据源包含的命名实体及其描述信息的集成方法。针对结构化半结构化数据,它采取构建映射规则,使系统可以在后期持续集成这些数据源中的实体信息,实验验证了集成方法的构建映射规则的有效性。 相似文献
17.
18.
This paper provides an integration scheme of heterogeneous data source based on ontology, and this scheme settles basically syntactic and semantic heterogeneity in heterogeneous data sources; meanwhile, it provides an effective technology measure for the interior information of enterprises to be shared in time accurately. 相似文献
19.
正则表达式与XML配置文件相结合的数据提取 总被引:1,自引:0,他引:1
针对特定搜索引擎的实际需求,需要从网站中提取有效的数据作为它的数据源.本文通过对网页内部结构的分析,利用正则表达式与XML配置文件相结合的方法,建立了基于特定网页的框架和规则的数据内容提取方法,并加以实现.该方法成功运用到多个信息提取系统中,实现了高效、准确的数据提取. 相似文献