首页 | 本学科首页   官方微博 | 高级检索  
     

一种列存储数据仓库中的数据复用策略
引用本文:王梅,周娇玲,乐嘉锦. 一种列存储数据仓库中的数据复用策略[J]. 计算机学报, 2013, 36(8)
作者姓名:王梅  周娇玲  乐嘉锦
作者单位:东华大学计算机科学与技术学院 上海 201620
基金项目:国家自然科学基金,上海市自然科学基金,the National Natural Science Foundation of China,the Natural Science Foundation of Shanghai
摘    要:数据复用是数据仓库管理中节约存储空间、提高查询效率的重要手段.列存储技术将来自同一属性的数据连续存储,极大地提高了数据仓库等分析型应用软件的性能,同时增加了复用的可行性和灵活性.为此,提出了一种列存储数据仓库中的数据复用策略.首先,利用模式匹配技术发掘候选可复用列,排除大量无法复用的数据列,在此基础上对候选可复用数据进行筛选和过滤,大大降低复用数据检测的复杂度.针对确定的可复用数据,提出了基于列存储的复用实现策略,分别给出了原始数据列、压缩数据列及索引数据列的复用实现方法.最后提出了基于复用数据的查询实现技术.在大规模数据仓库基准数据集上的实验结果验证了数据复用策略在减少存储量、节省数据装载时间及提升查询性能方面的有效性.

关 键 词:数据复用  数据仓库  列存储  模式匹配  可复用数据

A Data Reusing Strategy in Column-Store Data Warehouse
WANG Mei , ZHOU Jiao-Ling , LE Jia-Jin. A Data Reusing Strategy in Column-Store Data Warehouse[J]. Chinese Journal of Computers, 2013, 36(8)
Authors:WANG Mei    ZHOU Jiao-Ling    LE Jia-Jin
Abstract:
Keywords:data reusing  data warehouse  column-store  schema mapping  reusable data
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号