首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 93 毫秒
1.
XQuery语言查询优化策略研究   总被引:1,自引:0,他引:1  
XQuery查询语言在XPath路径查询的基础上使用FLWR等表达式实现XML数据的复杂查询或重构。查询优化是查询处理中重要的组成部分。文章提出了两个优化策略:路径的关联优化和FLWOR查询的重写,XMark实验表明能有效提高XQuery查询的执行效率。  相似文献   

2.
基于关系数据库有效地处理XPath函数   总被引:2,自引:0,他引:2  
函数是XQuery和XPath查询语言的重要组成部分,XQuery1.0和XPath2.0定义的函数库中包含16类函数。文章针对XPath的一个核心函数库,讨论了基于关系数据库中如何有效地处理XPath函数,并给出了有效地转换XPath函数到SQL查询的算法。实验结果表明,笔者提出的转换算法是通用、高效的。  相似文献   

3.
孙东海  张昱  吴晓勇 《计算机科学》2007,34(10):137-142
如何在XML流上高效地执行大量复杂XQuery查询是当今研究的热点之一。在数据选择分发等应用中,还希望在解析流的同时尽早地输出查询结果。为此,本文将XQuery查询的路径导航和结果构造两个阶段分别运行于服务器、客户机两端。导航阶段针对XQuery查询定义了扩展的基本XSIEQ机E-XSIEQ(Extended XML Stream Quervwith Immediate Evaluation),它是一种被索引化、基于栈的自动机。在EXSIEQ机上设计应用了TreeBuf(TreeBuffer)算法,它是一种树型提升缓冲的查询算法,算法使用了前缀共享计算的技术,能高效处理XQuery查询,而且能优化XPath查询。实验证明了TreeBuf算法的高效性。  相似文献   

4.
基于树自动机的XPath在XML数据流上的高效执行   总被引:18,自引:3,他引:18       下载免费PDF全文
如何在XML数据流上高效地执行大量的XPath查询成为数据流应用中一个迫切需要解决的关键问题.目前提出的算法或者不能完全支持XPath的常规特性,或者在算法的执行效率和空间代价上不能满足数据流应用的要求.提出了基于树自动机的XEBT机来解决这个问题.与传统方法相比,XEBT机具备如下特征:首先,XEBT机基于表达能力丰富的树自动机,无须附加中间状态,或保存中间结果,就能处理支持{[]}操作符的XPath;其次,XEBT机支持多种优化策略,包括基于DTD的XPath查询自动机的构造;在空间代价有限增加的情况下采用局部确定化减少并发执行的状态;采用自上而下和自下而上相结合的查询处理策略.实验结果表明,提出的方法能够支持复杂的XPath查询,在执行效率和空间代价方面优于传统算法.  相似文献   

5.
XQuery作为由W3C组织提出的一种XML查询语言,正在成为当前应用于XML数据库中对XML数据操作的一个规范。为了提高对XML中文本内容的查询支持,W3C又进一步设计了支持全文检索功能的语法规范。针对最新的XQuery及全文检索语法特征,文章提出了支持全文检索功能XQuery的解析与查询执行策略,为XQuery的查询处理提供解决方案。在此基础上,针对全文检索功能的查询执行计划,提出了适用于窗口查询,距离查询,是否排序查询的优化方案,以减少查询执行的代价,提高XQuery查询的效率。  相似文献   

6.
XML数据流上的关键字查询   总被引:3,自引:1,他引:3  
XML数据流上的XPath & XQuery查询处理是目前研究者关注的热点问题,但由于XPath & XQuery查询语言相对复杂,在不知道模式信息的前提下,用户很难通过已有的查询接口得到自己感兴趣的数据片断,因此如何在数据流模型上根据XML数据的特点为用户提供最友好的查询接口就成为一个亟待解决的问题.针对这个问题,创新地提出了在XML数据流上做关键字查询的问题,给出了最小相关连通子树(SRCT)的概念用于处理返回的结果,并设计了一种新的基于栈的Lookup算法,可以有效解决在XML数据流上进行关键字查询的问题,最后通过实验从不同角度对Lookup算法的各项性能指标进行了验证.  相似文献   

7.
基于Greenplum数据库的查询优化   总被引:1,自引:0,他引:1  
邹承明  谢义  吴佩 《计算机应用》2018,38(2):478-482
针对分布式数据库查询效率随着数据规模的增大而降低的问题,以Greenplum分布式数据库为研究对象,从优化查询路径的角度提出一个基于代价的最优查询计划生成方法。首先,该方法设计一种有效的代价模型来估算查询代价;然后,采用并行最大最小蚁群算法来搜索具有最小查询代价的连接顺序,即最优连接顺序;最后,根据Greenplum数据库对查询计划中不同操作的默认最优选择得到最优查询计划。采用该方法在自主生成的数据集与事务处理性能理事会测试基准(TPC-H)的标准数据集上进行了多组实验。实验结果表明,所提出的优化方法能有效地搜索出最优解,获得最优的查询计划,从而提升Greenplum数据库的查询效率。  相似文献   

8.
通过分析XQuery查询与XPath查询的区别与联系,定义了扩展的基本XSIEQ机E-XSIEQ,它是一种被索引化、基于栈的自动机。提出用变量表来收集XPath查询结果,并将这些中间结果组织成原子表集合,结果构造时能够根据原子表元组之间的上下文关系,对原子表集合快速地进行连接。描述了XQuery查询过程中的结构化连接算法,给出了结果构造的时间性能分析。  相似文献   

9.
基于LazyDFA的XPath在XML数据流上查询优化算法   总被引:2,自引:0,他引:2  
针对XML数据流上XPath查询处理及查询优化问题,给出了一种基于lazyDFA技术的解决方案,并提出了优化算法。共享NFA状态表,通过将NFA中的状态分成共享和独享两个状态集来降低lazyDFA的内存使用量;建立状态转移表优化算法通过在lazyDFA状态结构中增加一个状态转移表,来提高lazyDFA的查询速度。实验结果表明,提出的方法能够在执行效率和空间代价方面优于传统算法。  相似文献   

10.
企业信息集成中XQuery引擎的查询优化   总被引:1,自引:0,他引:1       下载免费PDF全文
通过分析研究已有的XQuery引擎和XQuery查询优化的方法,从减少编译时间和执行时间角度出发,提出了一种基于XQuery语句自身优化的新型综合性优化方法,经过XQuery中某常见查询进行仿真实验,可以说明该新型综合优化方法有较强的优势,可以大大地提高XQuery引擎的查询效率。  相似文献   

11.
XML查询语言XQuery是导航语言XPath的扩展,它是一种语法简单灵活且表现力强大的功能性语言。XQuery与XML数据结构有内在的联系,可以方便地编写业务逻辑,并且本质上就可以操作XML数据。本文对XQuery发展状况的进行了概要介绍,通过查询语言XQuery的主要概念,及XQuery语言在数据查询、转换等方面的应用分析,对XML文档查询语言的实际应用情况作出讨论。  相似文献   

12.
XML查询语言XQuery是导航语言XPath的扩展,它是一种语法简单灵活且表现力强大的功能性语言。XQuery与XML数据结构有内在的联系,可以方便地编写业务逻辑,并且本质上就可以操作XML数据。本文对XQuery发展状况的进行了概要介绍,通过查询语言XQuery的主要概念,及XQuery语言在数据查询、转换等方面的应用分析,对XML文档查询语言的实际应用情况作出讨论。  相似文献   

13.
Xindice是一种原生XML数据库,提供了对XML的存储和管理功能.但Xindice只提供了XPath查询语言,不能灵活满足对XML的查询要求.提出了用Java语言实现XQuery的机制,并提出了将其集成到Xindice中的方法,有效地扩充了Xindice的查询功能.  相似文献   

14.
XML is currently the most popular format for exchanging and representing data on the web. It is used in various applications and for different types of data including structured, semistructured, and unstructured heterogeneous data types. During the period, XML was establishing itself, data streaming applications have gained increased attention and importance. Because of these developments, the querying and efficient processing of XML streams has became a central issue. In this study, we survey the state of the art in XML streaming evaluation techniques. We focus on both the streaming evaluation of XPath expressions and of XQuery queries. We classify the XPath streaming evaluation approaches according to the main data structure used for the evaluation into three categories: automaton-based approach, array-based approach, and stack-based approach. We review, analyze, and compare the major techniques proposed for each approach. We also review multiple query streaming evaluation techniques. For the XQuery streaming evaluation problem, we identify and discuss four processing paradigms adopted by the existing XQuery stream query engines: the transducer-based paradigm, the algebra-based paradigm, the automata-algebra paradigm, and the pull-based paradigm. In addition, we review optimization techniques for XQuery streaming evaluation. We address the problem of optimizing XQuery streaming evaluation as a buffer optimization problem. For all techniques discussed, we describe the research issues and the proposed algorithms and we compare them with other relevant suggested techniques.  相似文献   

15.
In this paper, we address the problem of cardinality estimation of XPath queries over XML data stored in a distributed, Internet-scale environment such as a large-scale, data sharing system designed to foster innovations in biomedical and health informatics. The cardinality estimate of XPath expressions is useful in XQuery optimization, designing IR-style relevance ranking schemes, and statistical hypothesis testing. We present a novel gossip algorithm called XGossip, which given an XPath query estimates the number of XML documents in the network that contain a match for the query. XGossip is designed to be scalable, decentralized, and robust to failures—properties that are desirable in a large-scale distributed system. XGossip employs a novel divide-and-conquer strategy for load balancing and reducing the bandwidth consumption. We conduct theoretical analysis of XGossip in terms of accuracy of cardinality estimation, message complexity, and bandwidth consumption. We present a comprehensive performance evaluation of XGossip on Amazon EC2 using a heterogeneous collection of XML documents.  相似文献   

16.
XQuery语言的高性能实现需要利用XML查询代数提供的查询优化方法,也需要采取高效的树模式整体匹配算法。为了将这两种XML查询处理技术有效地结合在XQuery语言处理系统中,提出了一种通用系统框架来支持XQuery语言的高性能实现。在这个框架内,提供开放式XML数据源连接,并且通过作为中间语言的一种函数式查询计划描述语言FXQL来支持各种查询代数算子和树查询模式的表示,既允许采用各种XML查询代数,又允许采用各种树模式查询算法;进而,通过这种中间层的程序变换可以实现基于各种查询代数的查询重写,并从查询计划中分离出独立的树模式查询计算,使两种查询处理技术适当地统一在同一系统框架中,有效地支持了多种环境下XQuery语言的实现。  相似文献   

17.
XML数据的广泛应用,使得高性能的XQuery实现成为XML数据处理领域的重要课题,但XQuery的灵活性和复杂性为其实现技术研究提出了巨大挑战。XQuery语言的高性能实现需要利用XML查询代数提供的查询优化方法,也需要采取高效的树模式整体匹配算法。给出了XQuery语言实现的基础架构,探讨了原生XML数据库系统中XQuery实现的关键技术——查询代数和树模式查询的国内外研究现状,展望了未来的研究方向及面临的挑战。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号