共查询到20条相似文献,搜索用时 93 毫秒
1.
通过把数据立方体中的维分为划分维和非划分维,视图中的数据被分成两部分,分别存储在关系和多维数组中。针对这种混合存储结构,我们设计了一个数据立方体生成算法,它结合了流水线聚集方法和多维数组聚集方法的优点,大大减少了流水线的条数和所需要的存储空间,加快了计算速度。并用一个实际数据集进行了实验,结果表明该算法适用于计算高维的数据立方体。 相似文献
2.
Star Cube--一种高效的数据立方体实现方法 总被引:1,自引:2,他引:1
一个具有n个维的数据立方体有2^n个视图,视图越多,用于维护数据立方体的时间也就越长。通过将维分成划分维和非划分维,数据立方体可以转换成star cube.stal cube由一个综合表和那些仅包含划分维的视图组成。star cube使用前缀共享和元组共享技术不仅减少了所需的存储空间,还大大减少了计算和维护时间。在把一个分片限制在一个I/O单位的条件下,star cube的查询响应时间与数据立方体基本相同。实验结果也表明,star cube是一种在时空两方面均有效的数据立方体实现技术。 相似文献
3.
根据社保领域决策分析的需要,以参保人员分析主题为例,对数据立方体的结构进行设计并对如何在Essbase服务器上构建该数据立方体的方法进行了说明。实践证明该系统具有良好的性能指标.能够在规定的响应时间范围内进行指定的查询,基本满足用户分析需求。 相似文献
4.
封闭数据立方体技术研究 总被引:14,自引:1,他引:14
数据立方体中有很多冗余信息,去除这些冗余信息不但可以节约存储空间,还可以加快计算速度.数据立方体中的元组可以划分为封闭元组和非封闭元组.对任何一个非封闭元组,一定存在一个封闭元组,它们都是从基本表的同一组元组中经过聚集运算得到的,因而具有相同的聚集函数值.去掉数据立方体中所有的非封闭元组就产生了一个封闭数据立方体.提出了封闭数据立方体的生成算法、查询算法和增量维护算法,并使用合成数据和实际数据做了一些实验.实验结果表明,封闭数据立方体技术是有效的. 相似文献
5.
6.
针对传统联机分析处理(OLAP)处理大数据时实时响应能力差的问题,研究基于分布式内存计算框架Spark加速的数据立方体计算方法,设计基于Spark内存集群的自底向上构造(BUC)算法——BUCPark,来提高BUC的并行度和大数据适应能力。在此基础上,为避免内存中迭代的立方体单元膨胀,基于内存重复利用和共享的思想设计改进的BUCPark算法——LBUCPark。实验结果表明:LBUCPark算法性能优于BUC算法和BUCPark算法,能够胜任大数据背景下的快速数据立方体计算任务。 相似文献
7.
多维数据立方体模型及其基于关系的实现 总被引:6,自引:0,他引:6
数据立方体模型是多维数据库和以多维分析为基础的联机分析处理技术的核心机制。本文参照当前对鑫维数据立方体模型的最新研究成果,提出了一种新的模型并且应用于OLAP服务器基于关系的实现。并且提出了实现的难点和改进的方向。 相似文献
8.
提出一种新的数据立方体结构,通过索引和集合的交并运算来获得查询结果,特别是在进行区域查询时,避免了将区域分解为点后再依次进行点查询的方式,从而在保持较少的磁盘空间和较好的点查询响应速度的情况下,改善区域查询的性能;同时给出其生成和查询算法,并使用合成数据和实际数据进行了实验验证. 相似文献
9.
10.
11.
Ying Chen Frank Dehne Todd Eavis Andrew Rau-Chaplin 《Distributed and Parallel Databases》2004,15(3):219-236
The pre-computation of data cubes is critical to improving the response time of On-Line Analytical Processing (OLAP) systems and can be instrumental in accelerating data mining tasks in large data warehouses. In order to meet the need for improved performance created by growing data sizes, parallel solutions for generating the data cube are becoming increasingly important. This paper presents a parallel method for generating data cubes on a shared-nothing multiprocessor. Since no (expensive) shared disk is required, our method can be used on low cost Beowulf style clusters consisting of standard PCs with local disks connected via a data switch. Our approach uses a ROLAP representation of the data cube where views are stored as relational tables. This allows for tight integration with current relational database technology.We have implemented our parallel shared-nothing data cube generation method and evaluated it on a PC cluster, exploring relative speedup, local vs. global schedule trees, data skew, cardinality of dimensions, data dimensionality, and balance tradeoffs. For an input data set of 2,000,000 rows (72 Megabytes), our parallel data cube generation method achieves close to optimal speedup; generating a full data cube of 227 million rows (5.6 Gigabytes) on a 16 processors cluster in under 6 minutes. For an input data set of 10,000,000 rows (360 Megabytes), our parallel method, running on a 16 processor PC cluster, created a data cube consisting of 846 million rows (21.7 Gigabytes) in under 47 minutes. 相似文献
12.
空间Cube计算方法 总被引:3,自引:0,他引:3
随着卫星勘测、遥感影像、GPS等系统的广泛应用,目前各行各业拥有了大量的地理空间数据。空间数据仓库技术将较为成熟的数据仓库和联机分析处理技术应用到空间信息领域,以有效地支持空间分析和决策。空间Cube的构建与维护是空间数据仓库和空间联机分析处理的一个核心问题。文章在介绍空间数据仓库模型和空间Cube的基础上,结合空间聚集计算的特点,给出了几种空间Cube计算的有效方法。 相似文献
13.
14.
15.
16.
17.
Hua Luan 《计算机科学技术学报》2009,24(4):708-722
As the speed gap between main memory and modern processors continues to widen,the cache behavior becomes more important for main memory database systems(MMDBs).Indexing technique is a key component of MMDBs. Unfortunately,the predominant indexes—B~+-trees and T-trees—have been shown to utilize cache poorly,which triggers the development of many cache-conscious indexes,such as CSB~+-trees and pB~+-trees.Most of these cache-conscious indexes are variants of conventional B~+-trees,and have better cache perf... 相似文献
18.
空间数据仓库模型和空间Cube计算方法 总被引:4,自引:0,他引:4
1 引言据有关资料统计,目前人类拥有的各种信息90%以上与空间位置相关。随着各种计算机化的数据收集工具的广泛应用,目前人们积累了大量的地理空间数据。例如,各种数字化的专题地图:岩石类型分布地图、降水量地图、人口分布地图、行政区划地图等。同时,随着各类地理信息系统(GIS)软件的广泛应用,这些空间数据大多得到了有效的管理。 相似文献
19.
基于图形处理器的并行方体计算 总被引:1,自引:0,他引:1
方体(cube)计算是数据仓库和联机分析处理(Online analytical processing,OLAP)领域的核心问题,如何提高方体计算性能获得了学术界和工业界的广泛关注,但目前大部分方体算法都没有考虑最新的处理器架构.近年来,处理器从单一计算核心进化为多个或许多个计算核心,如多核CPU、图形处理器(Graphic Processing Units, GPU)等.为了充分利用现代处理器的多核资源,该文提出了基于GPU的并行方体算法GPU-Cubing,算法采用自底向上、广度优先的划分策略,每次并行完成一个cuboid的计算并输出;在计算cuboid过程中多个分区同步处理,分区内多线程并行.GPU-Cubing算法适合GPU体系结构,并行度高.与BUC算法相比,基于真实数据集的完全方体计算可以获得一个数量级以上的加速比,冰山方体获得至少2倍以上的加速. 相似文献
20.
通过扩展 BUC算法 ,提出了 HBUC算法 ,自底向上地计算维上带层次的数据立方 .HBU C算法的关键在于对层次之间的映像关系进行了合理地编码 ,并选择了恰当的层次扫描路线 ,这些不仅能够保证 HBU C算法继承和扩展BUC算法的优化过程 :Write- Ancestors和 Collapsing,而且使粗粒度级的聚集计算因为共享细粒度级的排序结果而得到加速 ,从而大大提高了 HBUC的计算效率 . 相似文献