首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
针对同时包含OR,AND和NOT谓词的复杂XMLTwig模式查询,提出一种标准的查询模式和对应的整体匹配算法AllTwigList.查询时将复杂Twig模式当作一个整体进行处理,避免因对复杂Twig模式进行分解而导致大量中间结果的产生和对同一查询节点的重复处理,有效减少查询处理规模.基于不同数据集的实验表明,使用AllTwigList算法可以很大程度提高查询处理的性能.  相似文献   

2.
越来越多的网络数据都以XML格式表示和存储,开发高效的查询处理算法以便从带有层次结构的XML文档中提取满足条件的数据是一个必须解决的问题.从XML文档中提取信息时,通常使用已有XML查询语言的核心组件—Twig查询—来表达查询语义.Twig查询的一个固有特点是其中的查询节点之间具有特定的先序关系,正是这一特点使其在很多情况下变得难以使用,从而不得不通过放宽Twig查询的约束条件来表达更灵活的语义.文中主要解决"不完全结构约束的查询(PSTP查询)"的处理问题.提出一种扩展的XPath语法,通过引入Samepath轴,可以以一种简单有效的方式表达灵活的查询语义;提出一种基于扩展XPath语法的查询处理算法pTwigStack,可以高效处理PSTP查询,从而避免分别处理PSTP查询对应的每个Twig查询所导致的性能下降问题;提出两种基于DTD schema的优化方法,用以改进pTwigStack算法的处理性能.不同数据集上的实验结果表明,pTwigStack算法在处理PSTP查询时,综合性能明显优于已有方法.  相似文献   

3.
如何在XML数据流上高效地执行XPath查询,是XML数据流管理的关键问题。DTD结构信息对提高XML查询效率有很大帮助,已有的大部分算法没有利用这一资源。提出了一种使用DTD进行XML数据流查询处理的方法,具有以下特征:利用树自动机表示XPath;通过XPath树自动机与DTD树匹配,预先标识不匹配查询结构的DTD节点;给出一种利用DTD的XML流索引方法DBXSI;执行查询时,根据流索引信息直接跳过某些与查询不匹配的节点及子树。实验结果表明:该方法可有效支持Xpath查询,效率优于传统算法。  相似文献   

4.
TwigStar——快速处理XML Twig查询中含通配符*的算法   总被引:1,自引:0,他引:1  
XMLTwig查询可以表示为一棵带标签结点的查询树,它支持对XML文档进行带有复杂谓词的结构或内容查询.整体(holistic)Twig查询算法已经被公认为XML查询处理的核心算法.很多学者提出了大量基于整体处理的XML Twig查询算法.但是目前已有的算法都只适合于Twig查询中不包含通配符*的情况.而当Twig查询中包含通配符*时,一种简单而直接处理的方法就是,把被查询文档中的所有结点元素都读到内存,把这些元素都看做通配符*所对应的元素,然后按照已有的算法进行查询处理.显然这种方法是不合理的,它会增加大量I/O开销.因此提出了一种有效地支持通配符*的查询处理算法.通过建立索引,它可以很好地处理含通配符*的查询,从而可以避免不必要的I/O开销.最后通过实验证明,算法要明显好于已有的算法.  相似文献   

5.
GML文档是XML技术在GIS方面的应用,成为空间数据在Internet上的实际表示、传输和交换的标准。目前,GML文档的查询是GIS领域的研究热点。对这一问题,研究了GML文档的数据特点和结构特点,设计了一种新的索引结构--GB树,GB树是专门针对GML文档中空间数据节点的索引结构。将XML Twig模式查询思想引入GML文档查询,借助GB树的索引特点,提出了GML文档的Twig模式查询算法--GMLTwigStackGB。GMLTwigStackGB算法保留了XML文档Twig模式查询算法的优势和特点,具有完整的空间查询功能。测试实验表明,该算法能够高效地满足GML文档上的各种数据查询。  相似文献   

6.
XML树模式查询又称为Twig查询,是XML查询处理中最核心的操作。在Twig查询算法的研究中,TreeMatch算法由于极大程度上减少了中间结果的产生,被认为是最好的Twig查询算法之一。然而,在TreeMatch算法的核心操作getNext中,存在不少仅依赖Twig模式的计算。当getNext调用次数很多时,这种冗余的重复计算会影响TreeMatch算法的性能。为了进一步改进该算法,提出了一种基于部分求值和热踪编译的Twig查询优化方法,该方法以Twig模式作为不变量进行部分求值,把查询请求翻译成一种Twig查询机指令序列,避免了查询过程中对Twig模式的重复计算;并且针对这种查询机指令序列的解释过程,利用热踪编译技术进行了优化。对比实验说明基于部分求值和热踪编译的优化方法能够将Twig查询效率提高到20%到60%。  相似文献   

7.
有效的索引技术是加速XML查询的重要因素.目前已有很多基于记录类和结构类的索引技术,但它们处理同时具有Twig和数据内容的查询时效果都不是很好.而提出的RD-IL索引技术能有效解决此类查询,同时也能有效解决涉及到以下几方面的查询:Twig、数据内容、ancestor-descendant.  相似文献   

8.
在XML数据库中的XML Twig查询是最近查询所关注的焦点,特别是基于整体的算法.很大部分查询算法是通过对XML文档进行编码来实现的,但是,这些算法忽略了文档中双生节点的共有特性.提出了用路径标记来代替已有的编码策略,通过路径标记策略,实现了一种新的基于压缩叶子流的Twig查询算法--CPJoin.不同于先前的算法,CPJoin不需要扫描文档中每一个节点,而是通过把具有相同特征的节点进行压缩来得到一个压缩流,只需要扫描对应查询叶子的压缩流,同时对于已有的两阶段算法,进行重组来减少中间结果的存储.最后,通过真实数据与合成数据上的实验结果来证明基于压缩叶子流的CPJoin算法,提高了Twig查询的性能.  相似文献   

9.
有效支持XML结构化连接的索引——CATI   总被引:1,自引:0,他引:1  
结构化连接的效率直接影响着XML查询的性能,目前对XML的结构化连接大多都是基于编码的方法.介绍了一种全新的有效支持XML结构化连接的树索引CATI(compact ancestor tree index)CATI的基本思想是,对于给定的一个祖先后代查询(A-D查询)或Twig查询,遍历XML文档,找出所有的祖先A的实例,用以建立CATI的主干;对于每个A实例,找出它的直接后代D的实例链接在它的后面.因为经典的结构连接算法Stack-Tree算法效率较高且使用较广,因此应用基于CATI的结构连接算法和基于Stack-Tree的结构连接算法就A-D查询和Twig查询做了大量实验.实验结果表明,基于CATI的结构化连接在一般查询情况下性能明显优于基于Stack-Tree的结构化连接.  相似文献   

10.
针对XML流数据的复杂Twig Pattern查询处理   总被引:2,自引:0,他引:2  
XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独的抽象语法树,因而能够以文档顺序、单遍地处理复杂Twig Pattern的匹配,并避免了YFilter中对嵌套谓词进行后置处理所产生的中间结果.实验结果表明,该方法能够有效改善Twig Pattern的处理性能,尤其是在处理大文档的情况下.基于已  相似文献   

11.
当前针对小枝模式的XML查询是XML文档查询的研究热点。文章在分析XML数据小枝查询处理常用算法的基础上,提出了一种高灵活性的、易确定结点对之间结构关系的EDiezt-P编码,并基于EDiezt-P编码和层次栈结构提出了一种自底向上的小枝查询算法。实验表明,该算法在一定程度上减少了查询处理时间,提高了查询效率。  相似文献   

12.
每一个复杂的Twig查询都由线性Twig查询构成,有效地处理线性Twig查询显得非常重要。DM XML系统以国产DM5.6关系数据库为平台,融合结构映射和模型映射,实现独特的路径分区编码方案来存储XML数据。在系统中,线性Twig查询解析后,形成线性Twig查询的路径集,而该集合中的每一个路径可被唯一变换为关系数据库中整型主键的范围查询。实验结果显示,路径分区编码方案能加速线性Twig查询,它将为高效实现复杂Twig查询奠定基础。  相似文献   

13.
设计和开发了面向对象的XML数据查询系统原型OOX(object-oriented XML).OOX系统中包括了面向对象XML数据查询系统的一些核心功能,如存储、索引、查询等.其最大的特点是:它是一个可以实现对富含面向对象XML数据进行查询的XML查询系统;支持用继承扩展的XML模式语言DTD的解析,支持用继承扩展的XML查询语言XML-RL;采用了先进的路经仓索引模式以及高效的查询处理技术,可以实现高效的查询处理.  相似文献   

14.
XML目前正在成为各种数据库特别是文档的首选格式,然而由于数据模型的差异.利用关系数据库查询处理XML数据给传统数据库技术带来新的挑战.通过一种基于DTD的XML关系数据库存储方法.该方法分别针对DTD和XML文档建立独立的表结构和索引,从而提高查询效率.  相似文献   

15.
XML文档的查询索引是当前研究的热点.该文探讨XML文档的索引技术,包括索引结构的设计等问题,给出了一个高效的XML索引方法,采用独特的编码方法,对XML文档及其遵循的DTD同时建立索引,有效支持内容和结构的双重检索;该方法结合了区间编码、倒排表和路径索引的思想,利用DTD结构信息来提高查询的效率.实验结果表明,本文提出的方法可以有效地降低建立XML数据索引的代价,能够缩短查询的响应时间.  相似文献   

16.
用XML对数据库查询的方法   总被引:14,自引:0,他引:14  
李京  庄成三 《计算机应用》2000,20(10):21-24
本文讨论了用XML查询数据库的具体实现方法。首先,提出了用DTD描述关系数据模式和利用ASP技术转化数据库的数据成XML文档方法;然后,用XML的查询语言XML-QL完成Web数据库上查询和数据集成等操作。  相似文献   

17.
提出了用Petri网建立XML语义结构模型的设计方法,根据XML的DTD结构建立描述XML语义结构的Petri网模型,DTD结构中的元素声明和属性声明对应Petri网模型中的一个或一组变迁,声明中的元素或属性对应Petri 网模型中的库所,把XML查询中的路径表达式定义为Petri网库所中的Token。根据Petri网模型的结构生成存储XML数据的关系数据库模型,将XML的查询问题最终转化为数据库中数据的查询操作。 XML;Petri网;路径表达式;查询  相似文献   

18.
目前已经提出的XML查询的方法大都是直接进行实例一级的查询,如XML文档树遍历及嵌套连接等。这些方法忽视了对XML格式信息的利用,当XML文档较大时,性能就会有明显下降。论文给出了一种直接利用DTD的格式信息对XML进行查询的算法XQAD。根据DTD和路径表达式的特点来减少对实例的访问次数,从而提高性能。XQAD还支持多谓词查询,包括结构谓词和值谓词。最后,用实验的方法同其它算法作比较,并对试验结果进行了分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号