首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于HBase的高效半结构化数据查询策略
引用本文:仇伟涛,范家铭,李丹.一种基于HBase的高效半结构化数据查询策略[J].福建电脑,2014(11).
作者姓名:仇伟涛  范家铭  李丹
作者单位:1. 河南大学 计算机与信息工程学院 河南 开封 475004
2. 河南大学 计算机与信息工程学院 河南 开封 475004; 河南大学空间信息处理实验室 河南 开封 475004; 中国科学院遥感与数字地球研究所 北京 100101; 国家航天局航天遥感论证中心 北京 100101
3. 河南大学 计算机与信息工程学院 河南 开封 475004; 河南大学空间信息处理实验室 河南 开封 475004
摘    要:本文用以Dremel系统为基础解决在HBase系统下如何查询大量的半结构化数据。基本原理是进行先进行数据预处理将半结构化数据进行拆分,将记录拆分成列使用表存储,拆分之后保持原有之间的半结构化数据的树之间的上下层关系,然后再查询的时候只查询条件相关的列,然后做集合计算,即可得到数据需要查询的结果,从而节省了很多时间。

关 键 词:大数据  Dremel  列存储数据库  Hbase  半结构化数据
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号