首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 99 毫秒
1.
基于移动行业的ETL方法及策略探讨   总被引:2,自引:1,他引:2  
基于移动行业的数据仓库,对数据抽取、数据转换、数据装载和数据审计的方法和策略进行了探讨,这些方法和策略对其他行业数据仓库的构建具有借鉴作用。  相似文献   

2.
基于移动行业的ETI方法及策略探讨   总被引:2,自引:0,他引:2  
王文彬  伍庆华等 《计算机工程》2003,29(2):120-121,269
基于移动行业的数据仓库,对数据抽取,数据转换,数据装载和数据审计的方法和策略进行了探讨,这些方法和策略对其他行业数据仓库的构建具有借鉴作用。  相似文献   

3.
数据提取、转换和装载技术研究   总被引:4,自引:0,他引:4  
来自企业操作环境的数据是数据仓库的数据源,通过提取、转换、装载填充数据仓库,对数据提取、转换与装载技术进行了研究与实践。对数据提取、转换与装载要解决的问题进行了详细论述并提出了相应的解决方法,并以MS SQL Server2000为例,介绍了可用于析取数据的一些工具。在此基础上,以电信行业话单数据载入数据仓库为实例,就如何实现各步骤进行了详细说明,提出了在数据提取、转换与装载过程中需注意的一些问题。  相似文献   

4.
Oracle中数据装载与数据重组的研究   总被引:1,自引:0,他引:1  
张岩  赵霁 《计算机应用》2004,24(6):185-187
数据装载和数据重组是在管理和维护Oracle数据库中经常遇到的问题。文中介绍了目前向Omcle数据库中装载数据的几种常用方法,并简要介绍了数据重组的问题。文中随后给出了这几种方法的使用原则以及性能分析,最后讨论了这几种方法的应用场合。  相似文献   

5.
为了提高多媒体数据的装载速度,达梦数据库提供了一种将海量的多媒体数据快速装载进数据库的方法.从文件准备、功能模块调用和数据装载3个方面,详细阐述了该方法的设计与实现,并通过一个实例来说明该方法的使用.  相似文献   

6.
杨程  陆佳民  冯钧 《计算机应用》2005,40(11):3184-3191
随着知识图谱的日益发展和在各个垂直领域的广泛应用,对于资源描述框架(RDF)数据的高效处理需求日益成为现代大数据管理领域中的新课题。RDF是W3C提出的用于描述知识图谱实体以及实体间关系的数据模型。为了有效地应对大规模RDF数据的存储和查询,很多学者考虑在分布式环境中管理RDF数据。RDF数据的分布式存储所面临的关键问题是数据的划分,而划分的结果很大程度上决定了SPARQL的查询性能。从数据划分的角度,主要围绕两类:基于图结构的RDF数据划分方法和基于语义的RDF数据划分方法展开深入阐述。前者包括多粒度层次划分、模板划分和聚类划分,适用于通用领域查询的语义范畴较为宽泛的场景;后者包括哈希划分、垂直划分和模式划分,更加适用于垂直领域查询的语义范畴相对固定的环境。此外,针对几种典型的划分方法进行对比与分析,为未来RDF数据划分方法的研究提供参考。最后,对未来RDF数据划分方法的发展方向进行了归纳总结。  相似文献   

7.
刘强  翁惠玉 《计算机工程》2004,30(Z1):30-31
基于电信行业的数据仓库,对其数据抽取、数据转换和数据装载的实现方法进行了探讨,这些方法对其他行业数据仓库的构建具有 借鉴作用。  相似文献   

8.
使用ETL过程将数据源数据装载到数据仓库,大多数时候是向数据仓库中追加数据,但有时也需要删除一些数据,以维持数据仓库中数据的正确性.文章结合Oracle ETL工具的装载特点提出了一种对增量数据进行预处理的方法,以实现有删除数据的ETL装载,并给出了具体的设计.  相似文献   

9.
提出了一种新的面向科学计算的构件技术——编译指导的构件并行技术,旨在提高构件间的并行度和数据的局部性,避免通信瓶颈。该技术分为两个阶段:域划分和子构件组合。其中域划分利用了编译时的数据依赖分析技术,子构件纪合利用了所设计的基于区间数据的模糊聚类算法。  相似文献   

10.
数据仓库,联机分析处理和联机分析开采研究   总被引:6,自引:0,他引:6  
本文介绍了当前数据仓库系统的应用需求、基本特征、体系结构和构建技术;对传统的联机事务处理(OLTP)与联机分析处理(OLAP)进行了比较;分析了在数据仓库中实施OLAP使用的多维数据视图概念模型,同时介绍了建立在多维数据库(MDD)上的MOLAP,以及建立在星型(雪花)模型基础之上的ROLAP两种联机分析技术,并对数据开采联机分析处理在数据仓库系统中的集成-联机分析开采(OLAM)进行了研究。  相似文献   

11.
数据立方体在许多多维数据的数据仓库的高速OLAP操作中扮演着重要的角色.但是在许多高维的数据仓库的应用中,例如超过100维,大约106个元组,在这样高维下建立物化数据立方体是不可行的.利用最小方的方法可以在高维数据集上进行有效OLAP操作的方法.但每次进行OLAP操作所涉及的维大多有固定的分布,所以大量的查询都有重复计算.如果能部分物化与大多数OLAP操作相关维的立方体ID,就能在进行OLAP操作时可以大大的提高OLAP操作的效率.  相似文献   

12.
考虑到基于直接编码的栅格数据在计算效率和存储能力上的不足,提出一种便于代数操作的游程编码数据结构,以优化基于直接编码栅格数据的代数运算。介绍了基于该数据结构的游程"交"运算的实现方法,并在算法实现过程中完成游程属性的各种代数运算。提出使用这种游程的"交"运算完成多边形的叠置分析,其基本思路是:分别将两个图层中的多边形数据转换为游程集合,在栅格场中的任一行上使用叠加图的游程单元与底图上该行的游程集合执行"交"运算,逐行执行这种游程"交"运算得到两个图层之间多边形相交的结果游程集合,并根据"Union"、"Erase"等不同的叠置方式提取满足条件的游程单元,最后将游程矢量化为多边形数据输出。在叠置运算过程中,通过游程的"交"运算即能够实现图层间多边形的各种叠置方式,表明该运算具有很强的通用性。  相似文献   

13.
多核数字信号处理器(DSP)的性能常常受限于共享存储的长延迟Cache一致性访问.数据前向(forwarding)技术是隐藏长延迟访问的一种有效手段.根据多核DSP应用的两类重要特征,提出了一种面向共享存储多核DSP结构的数据流分簇前向技术DSCF(data stream clustered forwarding).DSCF方法的主要特点是:兼容基本的共享存储Cache一致性协议;不污染目标Cache;数据的传输速度能够与消费速度相匹配;系统结构的可扩展性好.典型测试程序的模拟评测表明,采用DSCF方法能够将Cache一致性失效率平均降低44%,将系统总体性能提升30%~70%.  相似文献   

14.
DMA传输方式下高速数据采集的DLL实现   总被引:2,自引:0,他引:2  
数据采集设备与PC主机之间的高速数据传输有FIFO(先进后出)和DMA两种主要方式。为在Windows环境下实现基于DMA传输方式的高速数据采集,研究了一种DLL方法。首先介绍了DMA传输方式下高速数据采集的基本原理,接着在Windriver底层驱动平台上构造了一个高速数据采集DLL,包括用于数据采集控制和DMA控制器操作的多个函数模块,最后给出用户应用程序调用该DLL进行高速数据采集的详细方法。  相似文献   

15.
三叉树结构及其实现   总被引:3,自引:0,他引:3  
本文定义了一种三叉树的结构。引进了三叉树抽象数据类型的概念。给出了一种多重链表的实现。最后对广义三叉树和三叉树林作了初步讨论.  相似文献   

16.
数据源集成系统中动态字典构造方法研究   总被引:2,自引:1,他引:1  
本文从异构数据源集成系统的角度出发,引入模板和动态字典的概念,统一描述各种数据源数据的模式。动态字典不仅能描述对象的结构特征,还能描述对象的行为特征,完全符合面向对象特点。除此以外,本文还引入五种模板操作的定义,并证明OIM对象操作的模板可由相应的模板操作构成,从而给出不通过扫描数据库,而是利用局部动态字典的模板操作构造集成系统全局动态字典的方法。  相似文献   

17.
In the real world, there exist a lot of fuzzy data which cannot or need not be precisely defined. We distinguish two types of fuzziness: one in an attribute value itself and the other in an association of them. For such fuzzy data, we propose a possibility-distribution-fuzzy-relational model, in which fuzzy data are represented by fuzzy relations whose grades of membership and attribute values are possibility distributions. In this model, the former fuzziness is represented by a possibility distribution and the latter by a grade of membership. Relational algebra for the ordinary relational database as defined by Codd includes the traditional set operations and the special relational operations. These operations are classified into the primitive operations, namely, union, difference, extended Cartesian product, selection and projection, and the additional operations, namely, intersection, join, and division. We define the relational algebra for the possibility-distribution-fuzzy-relational model of fuzzy databases.  相似文献   

18.
维空间的Skyline查询处理技术是近年来数据库技术领域的一个研究重点和热点.目前所有的研究工作都是直接在原始数据表上执行关系查询代数操作来获得最终的结果集,然而,随着原始数据表的数据量和维目标个数的增大,这些研究工作将不再适用.基于此,首次研究Skyline集合上的查询代数操作,使得Skyline查询处理的输入数据来自于小规模的Skyline结果集,而非海量的原始数据表.并且,首次给出一个集成多维对象集合和该对象集合上的Skyline结果集的形式化模型,该模型适合目前Skyline查询计算的应用,并在该模型的实例上研究Skyline集合的查询代数操作.同时,给出查询代数体系的代价评估模型.实验表明,给出的数据模型和查询代数体系具有有效性和实用性.  相似文献   

19.
改进的混合本体异构数据集成方法研究   总被引:1,自引:1,他引:0  
针对混合本体结构在异构集成系统扩展性上的不足,在形式化描述数据源及其本体结构的基础上,分析了基于本体的数据源设计过程,提出了两种数据源集成操作来吸收自治数据源中的特化概念来扩展全局本体,并将数据源实例投影到全局本体.系统集成操作分析表明了该方法既保证数据源设计的自治性,又使得系统拥有良好的扩展性.  相似文献   

20.
公司经过十多年的信息化建设,信息系统已全面覆盖企业经营、电网运行和客户服务等业务领域及各层级应用,为公司各项业务有效运转提供了有力支撑.但现今仍缺乏一套统一的企业级数据资产管理体系.为进一步提升数据在电网企业的价值,本文提出了一套基于数据中台的企业级数据资产管理体系,主要从数据质量提升优化、数据资产管理、数据共享服务构建3个方面对如何进行数据资产管理进行论述.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号