期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

周新张孝薛忠斌王珊《软件学报》2016,27(12):3067-3084

间隔查询作为重要的查询类型,广泛应用在社交网络、信息检索和数据库领域.为了支持高效的间隔查询,涌现出多种优化技术.尽管已有方法能够快速响应单个间隔查询,然而当查询负载超过服务器的处理能力时,70%的查询均不能在期望时间内得到响应.针对这一问题,提出采用共享执行策略优化间隔查询的方法SESIQ（shared execution strategy for interval queries）.SESIQ对间隔查询进行批处理,分析一组间隔查询间可共享的操作,减少重复数据的访问,从而降低磁盘I/O和网络传输代价,提高检索性能.理论分析并实验验证了SESIQ的可行性,基于两种真实数据集的大量实验结果表明,SESIQ是有效的,间隔查询的检索性能可提升数十倍. 相似文献

2.

基于 MapReduce 的 Skyline 查询优化算法?

杨启王芳黄树成《计算机与数字工程》2019,(9)

相似文献

3.

多查询共享技术研究综述

下载免费PDF全文

危剑豪夏烨峰宫学庆《软件学报》2021,32(10):3176-3202

传统的数据库系统围绕单次查询的模型构建,独立地执行并发查询.由于该模型的限制,传统数据库无法一次对多个查询进行优化.多查询共享技术旨在共享查询之间的公共部分,从而达到提高系统整体响应时间和吞吐量的目的.将多查询执行模式分为两类,介绍了各自的原型系统——基于全局查询计划的多查询原型系统和以运算符为中心的多查询原型系统,并... 相似文献

4.

基于MapReduce模型的范围查询分析优化技术研究

下载免费PDF全文

赵辉杨树强陈志坤尹洪金松昌《计算机研究与发展》2014,51(3):606-617

近年来,MapReduce并行计算模型受到工业界和学术界广泛关注.基于该模型的系统实现已在谷歌、雅虎、Facebook等大公司内部成功应用.然而,基于MapReduce的系统实现最初用于解决海量无结构、半结构化数据的批处理问题,例如生成倒排索引、计算网页的pagerank、日志分析等,在设计上缺乏针对海量结构化数据进行交互式分析处理的优化考虑,例如：它总是采用全数据集强力扫描的数据处理模式,这有悖于结构化数据管理中常用的操作模式——选择性查询分析处理.针对该问题,引入传统数据库管理领域中常用的全局索引技术,将其应用在基于MapReduce模型的开源项目Hadoop上,以block为粒度对Hadoop分布式文件系统上的结构化数据构建全局索引结构,并给出一种面向范围查询分析的作业编译与调度执行优化算法,主要目标是基于应用语义及辅助索引结构减少不必要的map任务数,进而优化作业的调度开销和执行开销.在实验验证阶段,给出了80%,50%,30%,10%四种数据选择率在3种集群规模下的优化效果,发现作业响应时间最高可提升5倍,I/O开销最高提升10倍,任务调度开销最高提升11倍. 相似文献

5.

基于机器学习的数据库查询性能优化方法探讨

徐多《信息与电脑》2025,(8):176-178

为提升数据库查询性能,文章首先探讨了传统查询优化方法与基于机器学习的查询优化技术,分析了传统查询优化的基本概念与方法,包括基于规则的优化、启发式优化等,并指出了其局限性;其次,探讨了机器学习在查询优化中的应用,特别是查询执行计划预测;最后,分析了基于回归、分类模型的查询优化算法,以及深度学习和强化学习在此领域的应用。研究表明,机器学习方法能有效提高查询优化的准确性与效率,特别是在处理复杂查询优化问题方面,深度学习和强化学习展现出巨大的潜力。未来,应加强机器学习模型的融合与优化,以进一步提升数据库性能。相似文献

6.

基于改进蚁群算法的数据仓库多连接查询优化

赵鹏王守军龚云《计算机工程》2012,38(1):168-170,173

传统蚁群算法在解决数据仓库查询优化问题时存在过早收敛、收敛速度慢的缺点。为此,对传统蚁群算法进行改进,将伪随机状态转移规则引入最大最小蚁群系统,在每次迭代结束后进行迭代局部搜索。实验结果表明,改进算法在多表连接查询优化中具有较快的收敛速度,能提高最优解的质量。相似文献

7.

非均匀数据分布下的MapReduce连接查询算法优化

《计算机科学与探索》2017,(5):752-767

MapReduce分布式计算框架有助于提升大规模数据连接查询的效率,但当连接属性分布不均匀时,其简单的散列策略容易导致计算节点间负载不均衡,影响作业的整体性能。针对连接查询操作中的数据倾斜问题,研究了MapReduce框架下大规模数据连接查询操作的优化算法。首先对经典的改进重分区连接查询算法进行实验分析,研究了传统MapReduce计算框架下连接查询操作的执行流程,找出了基于MapReduce计算框架的连接查询算法在数据分布不均匀时的性能瓶颈;进而提出了组合分割平衡分区优化策略,设计并实现了基于组合分割平衡分区优化策略的改进型连接查询算法。实验结果表明,提出的优化策略在大规模数据的连接查询处理上很好地解决了数据倾斜带来的性能影响,具有好的时间性能和可扩展性。相似文献

8.

基于丛生树的片段式并行查询优化技术研究

李庆华张捷《计算机工程与应用》1999,35(6):10-11,15

该文以丛生树模型为基础,提出了一种片段式查询执行计划。该执行计划将查询树划分成多个按流水线方式执行的片段,各片段依次执行。该执行计划可以减少中间结果的Ｉ／０次数,更充分地利用内存资源。文中还举例说明了计划的执行过程。相似文献

9.

MapReduce连接查询的I/O代价研究

下载免费PDF全文

宋杰李甜甜朱志良鲍玉斌于戈《软件学报》2015,26(6):1438-1456

数据的指数级增长给数据管理和分析带来了严峻的挑战.连接查询是数据分析中一种常用运算,而MapReduce是一种用于大规模数据集并行处理的编程模型,研究基于MapReduce的连接查询代价评估和查询优化,有着学术意义和应用价值.MapReduce连接查询算法的性能主要取决于I/O代价(包括本地和网络I/O),而I/O代价与数据集以及连接运算的特征参数相关,通过对二元连接的I/O代价评估可以优化多元连接执行计划.基于此,首先提出了二元连接查询的I/O代价模型;随后,对现有二元连接算法进行形式化定义和简单扩展,归纳出6种基于MapReduce连接查询算法,并通过算法白盒分析定义它们的I/O代价函数;最后,提出一种多元连接最优执行计划的选择算法.通过实验表明I/O代价模型的正确性且能够准确地反映算法的性能优劣. 相似文献

10.

浅谈在SQL Server2000中优化查询性能

周文君《福建电脑》2009,25(4):173-174

本文主要讨论如何获取查询优化器所产生的最佳执行计划,对在不同环境不同状态下所获取的执行计划进行分析,在此基础之上,介绍了在SQL Server2000中优化查询的一般方法。相似文献

11.

并行查询下查询执行计划的选择

裴泽锋牛保宁张锦文 Amjad Muhammad 《计算机应用》2020,40(2):420-425

查询是数据库系统的主要负载,其效率决定了数据库性能的好坏。一个查询存在多种执行计划,当前,查询优化器只能按照数据库系统的配置参数,静态地为查询选择一个较优的执行计划。并行查询间存在复杂多变的资源争用,很难通过配置参数准确反映,而且同一执行计划在不同情景下的效率并不一致。并行查询下执行计划的选择需考虑查询间的相互影响——查询交互。基于此,提出了一种在并行查询下度量查询受查询交互影响大小的标准QIs。针对并行查询下查询执行计划的选择,还提出了一种动态地为查询选择执行计划的方法TRating,该方法通过比较查询组合中按不同执行计划执行的查询受查询交互影响的大小,选择受查询交互影响较小的执行计划作为该查询的较优执行计划。实验结果表明,TRating方法为查询选择较优执行计划的准确率达61%,相比查询优化器提高了25%;而且在为查询选择次优执行计划时,其准确率也高达69%。相似文献

12.

SQL Server查询优化器原理与优化实例分析

刘维学《计算机技术与发展》2013,(11):108-111

查询是数据库的核心操作,随着数据库技术的发展以及数据量急剧增加,对查询性能的要求越来越高,查询优化成为数据库管理系统亟待解决的重要问题。文中针对应用最广泛的SQL Server数据库的查询优化器进行研究。通过图形研究查询优化器的工作原理,并深人分析提交SQL语句、解析、代数化、查询优化、编译、执行、结果等查询优化器的工作步骤;进行实例分析,运用图形表示了逻辑树和经过优化后得到的查询执行计划。结果表明,SQL语句是查询优化的基础,实际应用时需要写出符合查询优化器规则的SQL语句。相似文献

13.

使用图神经网络选择并行查询的执行计划

《计算机工程与应用》2023,59(13)

查询作为数据库系统（database system;DBS）占比最大的操作;其效率在很大程度上影响着DBS的性能;为查询选择一个较优的执行计划、提高查询效率是提高DBS效率的关键。查询执行受到其他查询的影响产生查询交互（query interaction;QI）;是查询优化器难以为并行查询选择较优执行计划的主要因素。提出一种以操作为单位表示查询执行计划的编码方式（features of plans based on operator;FPO）;并用操作之间的数据共享关系以及资源竞争关系反映QI;在此基础上;提出基于图神经网络的查询执行计划选择模型（plan selection based on graph;PSG）。PSG将操作作为节点;操作特征作为节点特征;操作间的关系作为边;生成异构图;作为模型的输入;考虑到操作间的关系有多种、作用不同;使用关系图卷积网络（relational graph convolutional network;RGCN）聚合信息;得到查询组合的图表示;提取其QI;通过全连接层（fully connected layers;FC）;为查询选择执行计划。在PostgreSQL上的实验表明;PSG的平均准确率比查询优化器提高了47.3个百分点。相似文献

14.

基于LBT树的并行数据库查询优化方法

许向阳高东升蔡季萍《小型微型计算机系统》2003,24(10):1772-1775

本文提出了一种基于LBT(Linear-Bushy-Tree)树的查询优化方法，它是对基于浓密树(Bushy-Tree)查询优化方法的一种改进。这种优化方法大大地缩减了查询执行计划空间，确保了并行查询执行计划的优化性。这种优化方法已经在我们自主研制的并行数据库管理系统PDBMS^[1,4]中得到实现。相似文献

15.

基于Hadoop的RDF数据存储及查询优化_*

徐德智刘扬 Sarfraz Ahmed 《计算机应用研究》2017,34(2)

相似文献

16.

Extending a multi-set relational algebra to a parallel environment

Paul W. P. J. Grefen Jan Flokstra 《Distributed and Parallel Databases》1996,4(1):81-99

Parallel database systems will very probably be the future for high-performance data-intensive applications. In the past decade, many parallel database systems have been developed, together with many languages and approaches to specify operations in these systems. A common background is still missing, however. This paper proposes an extended relational algebra for this purpose, based on the well-known standard relational algebra. The extended algebra provides both complete database manipulation language features, and data distribution and process allocation primitives to describe parallelism. It is defined in terms of multi-sets of tuples to allow handling of duplicates and to obtain a close connection to the world of high-performance data processing. Due to its algebraic nature, the language is well suited for optimization and parallelization through expression rewriting. The proposed language can be used as a database manipulation language on its own, as has been done in the PRISMA parallel database project, or as a formal basis for other languages, like SQL.Recommended by: Patrick Valduriez 相似文献

17.

并行查询交互度量及执行计划选择

柳浩楠牛保宁程永强《计算机工程与应用》2022,58(17):72-80

查询是数据库系统的主要负载,查询的执行效率直接影响着系统的性能。目前,由于查询交互（query interaction,QI）复杂多变,查询优化器不能准确地评估查询进入系统产生的影响,很难为并行查询选择较优执行计划。将查询的平均响应时间、平均执行时间、平均I/O时间和平均缓冲区命中率作为QI的特征参数,表示QI;提出多维度查询交互度量（multi-dimensional measurement of query interaction,MMQI）模型和执行计划选择（execution plan selection,EPS）模型,采用深度神经网络,在度量QI的基础上,把QI作为主要因素,为并行查询选择较优执行计划。考虑到查询执行计划是由一系列关系运算组成的,以及QI具有时域特性,MMQI采用双向长短期记忆神经网络（bidirectional long-short term memory,Bi-LSTM）度量QI,从查询执行计划提取特征作为输入,将QI特征参数的改变作为输出,预测查询采用不同执行计划进入系统后QI特征参数的改变;EPS把预测到的查询特征参数的改变作为查询交互特征（feature of query interaction,FQI）,与查询候选执行计划特征（features of candidate plan,FCP）融合,作为另一个Bi-LSTM的输入,为查询动态地选择较优执行计划。在PostgreSQL上的实验表明,MMQI-EPS比查询优化器选择较优执行计划的平均准确率提高38.6个百分点。相似文献

18.

基于MapReduce的多元连接优化方法

下载免费PDF全文

李甜甜于戈郭朝鹏宋杰《计算机研究与发展》2016,53(2):467-478

多元连接是数据分析最常用的操作之一,MapReduce是广泛用于大规模数据分析处理的编程模型,它给多元连接优化带来新的挑战：传统的优化方法不能简单地适用到MapReduce中;MapReduce连接执行算法尚存优化空间.针对前者,考虑到I/O代价是连接运算的主要代价,首先以降低I/O代价为目标提出一种启发式算法确定多元连接执行顺序,并在此基础上进一步优化,最后针对MapReduce设计一种并行执行策略提高多元连接的整体性能.针对后者,考虑到负载均衡能够有效减少MapReduce的“木桶效应”,通过任务公平分配算法提高连接内部的并行度,并在此基础上给出Reduce任务个数的确定方法.最后,通过实验验证本文提出的执行计划确定方法以及负载均衡算法的优化效果.该研究对大数据环境下MapReduce多元连接的应用具有指导意义,可以优化如OLAP分析中的星型连接、社交网络中社团发现的链式连接等应用的性能. 相似文献