首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 515 毫秒

1.  基于ORV的并行多表连接查询算法  
   姜合  赵培英《计算机应用与软件》,2005年第22卷第8期
   为提高数据仓库中多表连接的查询处理响应时间,本文结合数据仓库中多表连接的特点,利用面向对象中的消息机制,提出了一种基于ORV(对象关系视图)的并行多表连接查询算法,并对算法的磁盘I/O操作块数进行了分析,与单处理机及传统的多表连接算法进行了比较。    

2.  一种提高数据仓库查询效率的有效方法  
   郭峻峰  倪志伟  高雅卓  伍章俊《计算机集成制造系统》,2009年第15卷第12期
   为了提高数据仓库的查询性能和效率,基于数据仓库本身组织和联机分析处理查询的特点,结合倒排索引、连接索引和聚集表,提出一种新的综合索引模型2H3I,并给出相应的算法.该模型在保证常用查询性能较高基础上,也提升了非常用查询的效率.理论分析和实验结果表明,2H3I是可行和有效的.    

3.  基于Hadoop 的高效连接查询处理算法CHMJ  被引次数:3
   赵彦荣  王伟平  孟丹  张书彬  李均《软件学报》,2012年第23卷第8期
   提出了一种并行连接查询处理算法CoLocationHashMapJoin(CHMJ).首先,设计了多副本一致性哈希算法,将具有连接关系的表根据其连接属性的哈希值在机群中进行分布,在提升了连接查询处理中数据本地性的同时,保证了数据的可用性;其次,基于多副本一致性哈希数据分布,提出了HashMapJoin并行连接查询处理算法,有效地提高了连接查询的处理效率.CHMJ算法在腾讯公司的数据仓库系统中进行了应用,结果表明,CHMJ连接查询的处理效率比Hive系统提高了近5倍.    

4.  封闭立方体反转索引查询优化技术 *  
   肖伟吉  奚建清  欧国华《计算机应用研究》,2008年第25卷第10期
   处理用户复杂查询请求的速度是数据仓库关键性能之一。论述了在 QC算法产生的聚集表上建立反转索引和查询并还原出立方体上界的方法 ,查询算法包括位图查询算法和反转列表查询算法。最后进行了性能测试 ,结果表明这两种算法均能够提高查询的速度。    

5.  多版本数据仓库的查询优化设计  
   鲍蓉《计算机工程与应用》,2008年第44卷第28期
   多版本数据仓库中,不同数据仓库版本的维度实例可以共享存储。直接建立维度表与事实表的位图连接索引会产生大量无用的索引项,影响查询效率。给出了一种数据仓库版本的形式定义和维度实例的共享存储方式,并在此基础上设计了查询优化算法DWVOQ,通过建立维度实例的版本视图及其与事实实例的连接索引来降低索引空间代价,提高索引查询效率。    

6.  一种复杂多维层次的连接和聚集算法  
   黄震华  薛永生  段江娇  王劲波《计算机研究与发展》,2004年第41卷第8期
   由于数据仓库中存储着不同粒度、容量巨大的数据记录,所以如何有效地执行联机分析处理(OLAP)查询操作,特别是连接和聚集操作,便成为数据仓库领域的核心问题之一.为此,提出了一种降低连接和聚集操作的新算法(join and aggregation based on the complex multi-dimensional hierarchies,JACMDH).算法充分考虑了复杂多维层次的特点,在原有的位图连接索引(bitmap join index)的基础上,采用层次联合代理(hierarchy combined surrogate)和预先分组排序的方法,使得复杂的多维层次上的连接和聚集操作转化成事实表上的区域查询,从而在处理多维层次聚集的同时,提高了连接和聚集的效率.算法性能分析和实验数据表明,JACMDH算法和目前流行的算法相比,其性能有显著的提高.    

7.  星型模型的轮廓连接查询算法  
   徐忠华  张剡  陈玲  柏文阳《计算机科学与探索》,2010年第4卷第5期
   轮廓查询在多标准决策中具有重要应用价值,对于单表轮廓查询已有大量研究,但在实际中,轮廓查询的属性很可能分布在多张表中。如果在多表连接之后进行轮廓查询,随着维度和元组数目的增加,计算代价会越来越大。为此,针对数据仓库中星型模型的数据特点,提出了三种此模型下的多表连接轮廓查询算法并对算法进行了实验比较分析。结果表明,此算法比先连接再做单表轮廓查询的算法更为有效,并且这三种算法在不同特点的数据集合下会表现出各自的优势。    

8.  数据仓库索引启发式查询优化方法  被引次数:1
   黄金钗  杨科华  陈楠楠《计算机工程与应用》,2010年第46卷第3期
   在大型数据仓库查询过程中,经常涉及多事实表的连接操作。传统的查询优化方法是在计算多关系连接时尽可能地减少中间关系的大小,并没有考虑到数据仓库中数据的海量,以读为主且事实表一般建有索引的特点,往往无法取得最优的效果。针对数据仓库查询的特点,提出了一种利用索引加快查询的启发式优化方法。理论分析与实验表明,该方法在查询处理代价和执行时间上都明显减少,方法具有有效性。    

9.  基于分组序号的聚集算法  被引次数:3
   冯建华  蒋旭东  孟宪虎《软件学报》,2003年第14卷第2期
   联机分析处理OLAP(online analytical processing)查询作为一种复杂查询,当使用SQL(structured query language)语句来表述时,通常都包含多表连接和分组聚集操作,因此提高多表连接和分组聚集计算的性能就成为ROLAP(relational OLAP)查询处理的关键问题.提出一种基于分组序号的聚集算法MuGA(group number based aggregation with multi-table join),该方法充分考虑数据仓库星型模式的特点,将聚集操作和新的多表连接算法MJoin(multi-table join)相结合,使用分组序号进行分组聚集计算,代替通常的排序或者哈希计算,从而有效地减少CPU运算以及磁盘存取的开销.算法的实验数据表明,提出的MuGA算法与传统的关系数据库聚集查询处理方法以及改进后的基于排序的聚集算法相比,性能都有显著提高.    

10.  一种基于维层次编码的OLAP聚集查询算法  被引次数:10
   胡孔法  董逸生  徐立臻  杨科华《计算机研究与发展》,2004年第41卷第4期
   联机分析处理(OLAP)查询往往需在海量数据上进行即席的复杂分组聚集查询,在其SQL语句中通常包含多表连接和分组聚集操作,因而减少多表连接和压缩关键字,以及对查询数据进行有效地分组聚集操作,成为ROLAP查询处理的关键问题。提出了一种基于维层次编码的新型预分组聚集算法DHEPGA.DHEPGA算法充分利用了编码长度较小的维层次编码及其前缀,来快速检索出与查询关键字相匹配的维层次编码,求得维层次属性的查询范围,减少了I/O开销,提高了OLAP查询效率。理论分析和实验结果表明,DHEPGA算法性能是非常有效的。    

11.  实现Web数据库关联查询的几种方法  
   孟晓明  张建华《信息技术》,2005年第29卷第6期
   简述了几种常用的Web数据库连接技术,并对其进行了分析和比较;给出了实现Web数据库关联查询的关系数据库方法和Delphi方法,其中在后一种方法中又给出了连接Paradox和dBASE进行异库关联查询和MS Access多表关联查询两种方法;每种方法都给出了查询实例。    

12.  基于动态镜像的实时数据仓库存取预处理技术研究  
   毛莺池  闵 伟  接 青  朱沥沥《计算机科学》,2015年第42卷第12期
   实时数据仓库是数据仓库技术的重要分支,而实时数据查询和实时数据导入引发的查询竞争问题一直是实时数据仓库技术研究的重点之一。查询竞争问题严重影响了查询分析的精度和效率,还降低了数据仓库的性能。提出了一种在数据仓库外部构建动态存储区域的方法,它采用动态镜像技术,有效地缓解查询竞争问题。同时,为了提高实时OLAP上的查询分析操作的性能,提出了蝇量级物化方法及蝇量级物化下的表连接算法FWMJoin(Fly-Weight Materialization Join)。基于TPC-H基准的实时数据仓库测试系统,针对动态镜像技术下的动态存储区域的OLAP性能进行分析与评估,并对实验结果进行总结。    

13.  数据仓库系统中一种高效的多维层次聚集算法  被引次数:1
   胡孔法  陈崚  顾颀  蔡俊杰  董逸生《计算机集成制造系统》,2007年第13卷第1期
   如何减少联机分析处理中多表连接和压缩维属性连接关键字,对查询数据进行有效地分组聚集操作,成为联机分析处理查询处理的关键问题.为此,提出了一种基于多维层次编码的新型预聚集算法MDHEPA.该算法充分利用编码长度较小的多维层次编码及其前缀,对事实表中的数据进行快速地分组聚集计算,大大减少和简化了多表连接操作,提高了联机分析处理查询效率.理论分析和实验结果表明,该算法是有效的.    

14.  提高数据仓库中查询性能的一种并行多表连接算法  被引次数:3
   赵培英  李庆忠  王海洋《计算机工程》,2002年第28卷第10期
   星型模式是当前数据仓库设计中广泛采用的逻辑模式,针对星型模式数据仓库中潜在的查询性能问题,结合数据仓库中的ORV,利用面向对象中的消息机制,提出了基于对象关系视图(ORV)的多表连接并行查询算法,并对算法的磁盘I/O操作次数、算法的时间复杂度进行了分析。    

15.  一种基于多连接属性划分的查询优化算法  
   褚龙现  申远《计算机与现代化》,2012年第5期
   查询操作是数据库中最常用的操作,由于分布式数据库的数据分布性和冗余性,使得查询优化处理成为分布式数据库研究的核心问题之一。为了提高分布式数据库查询效率,分析讨论了基于直接连接的常见执行策略和查询优化算法,同时针对分布式数据库应用中多表连接时存在多连接属性,提出一种改进的直接连接查询优化策略。改进后的算法提高了查询执行的并行性,缩短了查询处理时间,提高了查询效率。    

16.  数据仓库中的一种提高多表连接效率的有效方法  被引次数:4
   文娟  薛永生  翁伟  林子雨《计算机研究与发展》,2005年第42卷第11期
   联机分析处理OLAP查询经常涉及多表连接,所以提高多表连接的性能就成了提高OLAP查询处理的关键性问题.针对目前直接提高多表连接效率的方法、并行多表连接算法和连接索引,提出了变形多表连接索引.该方法基于使用SQL语句表述的查询模型库QMB建立一系列符合条件的变形多表连接事实表,并建立这些变形多表连接事实表的索引.在特定的多表连接查询中,变形多表连接事实表能替代原事实表与各维表连接,并在查询处理过程中动态更新.理论分析和实验结果表明,该方法可以有效地提高多表连接的查询效率.    

17.  一种改进的联机分析处理中的聚集算法  
   王轶讴  王秀坤  赫然  孟凡辉《计算机工程》,2005年第31卷第2期
   联机分析查询处理是一种涉及大量数据的即席复杂查洵,它通常都包含分组聚集运算。分析了关系数据仓库星型模式存储结构和数据更新的特点,把实体关系看成分布式数据库中以内存排序缓冲区人小为分段条件的全局关系,对分组操作进行分布式聚集运算,给出了一种改进的MuSA算法,有效地提高了算法性能。    

18.  常用OLAP查询优化方法性能分析  被引次数:1
   张银玲  武彤《微机发展》,2014年第1期
   OLAP(OnlineAnalyticalProcessing)查询常常涉及到不同的维表和事实表,要得到查询结果通常需要进行多张表的连接操作。连接操作是一种非常耗时的操作,因此,如何提高OLAP查询效率成为数据仓库应用中的关键问题。文中对存储过程、索引技术、物化视图等几种常用的OLAP查询优化方法进行性能分析,针对特定应用通过反复实验比较得出物化视图的优越性。而就物化视图而言,其本身有优越性的同时也存在一些缺陷。因此,针对物化视图更新问题提出了几种更新方案。    

19.  MapReduce连接查询的I/O代价研究  
   宋杰  李甜甜  朱志良  鲍玉斌  于戈《软件学报》,2015年第26卷第6期
   数据的指数级增长给数据管理和分析带来了严峻的挑战.连接查询是数据分析中一种常用运算,而MapReduce是一种用于大规模数据集并行处理的编程模型,研究基于MapReduce的连接查询代价评估和查询优化,有着学术意义和应用价值.MapReduce连接查询算法的性能主要取决于I/O代价(包括本地和网络I/O),而I/O代价与数据集以及连接运算的特征参数相关,通过对二元连接的I/O代价评估可以优化多元连接执行计划.基于此,首先提出了二元连接查询的I/O代价模型;随后,对现有二元连接算法进行形式化定义和简单扩展,归纳出6种基于MapReduce连接查询算法,并通过算法白盒分析定义它们的I/O代价函数;最后,提出一种多元连接最优执行计划的选择算法.通过实验表明I/O代价模型的正确性且能够准确地反映算法的性能优劣.    

20.  数据仓库中雪花模式的Skyline-Join查询  
   陈玲  徐忠华  张剡  肖旭生  柏文阳《计算机研究与发展》,2009年第46卷第Z2期
   Skyline查询能够有效地实现多目标最优化,而数据仓库中的OLAP也是针对多维数据进行分析,因此,针对Skyline查询在数据仓库中的应用,提出了数据仓库中雪花模式的Skyline-Join查询算法.该算法首先将子维表M-Join父维表,然后渐进选择式地对事实表和父维表进行连接.每次连接之前都对事实表进行分组和组内Skyline计算,删除组内非Skyline元组,这样可以减少许多不必要的连接操作,使得查询效率大大提高.通过实验证明,在事实表元组数量逐渐变大和维表个数逐渐增多的情况下,提出的算法比先Join后Skyline计算的naive算法效率上有明显改善.    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号