首页 | 本学科首页   官方微博 | 高级检索  
     

一种数据仓库数据立方体空间采样估计策略
引用本文:林友芳,李红松,黄厚宽. 一种数据仓库数据立方体空间采样估计策略[J]. 计算机研究与发展, 2002, 39(11): 1519-1525
作者姓名:林友芳  李红松  黄厚宽
作者单位:北方交通大学计算机科学与技术系,北京,100044
基金项目:铁道部科技研究开发项目基金资助 ( 2 0 0 0 X0 30 -A,2 0 0 1X0 2 2 )
摘    要:对数据仓库多维视图进行容量估计是数据立方体设计,数据仓库存储规划和实现查询优化的基础,首先以统计理论为基础,提出了一种基于采样的数据仓库数据立方体空间估计策略,该策略针对不同类型的多维视图,对样本统计结果采用不同的空间放大策略,确保了估计结果具有较高的准确性,同时,该策略在最大估计的基础上采用一些启发式规则,对估计视图集进行有效的约简,并对估计过程中采用了样本视图预物化思想,根据预物化视图集生成优化的立方体空间估计序列,从而大幅缩短了整体估计时间。

关 键 词:数据仓库 数据立方体 多维视图 视图空间估计 采样 数据库

A CUBE SIZE ESTIMATION STRATEGY OF DATA WAREHOUSE BASED ON SAMPLING
LIN You-Fang,LI Hong-Song,and HUANG Hou-Kuan. A CUBE SIZE ESTIMATION STRATEGY OF DATA WAREHOUSE BASED ON SAMPLING[J]. Journal of Computer Research and Development, 2002, 39(11): 1519-1525
Authors:LIN You-Fang  LI Hong-Song  and HUANG Hou-Kuan
Abstract:Size estimation of multidimensional views of data warehouse is a fundamental step for data cube design, warehouse storage planning, and query optimization. In this paper, a sampling-based cube size estimation strategy of data warehouse based on statistical theories is proposed. It applies different sampling size enlargement strategies to different kinds of views to ensure a satisfactory accuracy. Furthermore, It applies some heuristic rules in reducing the cube views according to the result of maximum estimation. An idea of sampling view pre-materialization is also proposed, which may result in a pre-materialized view set for generating an optimal estimation sequence of cube views that sharply reduces the total estimation time.
Keywords:data warehouse   data cube   multidimensional view   view size estimation   sampling  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号