首页 | 本学科首页   官方微博 | 高级检索  
     

基于抽样的Cube占用空间预测算法
引用本文:张季,周立柱,蒋旭东,冯建华.基于抽样的Cube占用空间预测算法[J].计算机工程与应用,2001,37(24):104-107.
作者姓名:张季  周立柱  蒋旭东  冯建华
作者单位:清华大学计算机科学与技术系,北京,100084
基金项目:国家973重点基础研究发展项目资助(编号:g1998030414)
摘    要:在数据仓库的设计中实物化视图的选择有赖于对cube占用存储空间大小的预测,然而传统的基于数据均匀分布的抽样预测算法不能准确地估计cube的大小。文章介绍了一种利用抽样原理预测cube大小的算法,这种算法能够自适应不同程度的数据倾斜,特别适用于数据倾斜程度较大的情况。实验数据表明,该算法对传统的抽样预测算法有明显的改进效果。

关 键 词:抽样  存储预测  cube  数据倾斜  数据仓库  实物化视图  联机分析处理
文章编号:1002-8331-(2001)24-0104-04
修稿时间:2001年3月1日

A Novel Sampling-based Cube Storage Estimation Algorithm
Zhang Ji,Zhou Lizhu Jiang Xudong Feng Jianhua.A Novel Sampling-based Cube Storage Estimation Algorithm[J].Computer Engineering and Applications,2001,37(24):104-107.
Authors:Zhang Ji  Zhou Lizhu Jiang Xudong Feng Jianhua
Abstract:In the design of Data Warehouse,the selection of materialized view depends on the estimation of the storage of Cubes.However,the traditional estimation algorithms ,which are based on the assumption of uniformly distributed data,cannot estimate the size of the Cubes accurately.This paper introduces a novel sampling-based cube storage estimation algorithm.This algorithm can automatically adapt to biased data of various degree,especially when the degree is high.Experiments demonstrate its improvement on the traditional algorithms.
Keywords:Sampling  Storage Estimation  Cube  Data bias  Data Warehouse  Materialized View  On-line Analytical Pro-cessing(OLAP)  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号