首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于区间编码的XML索引结构的有效结构连接   总被引:22,自引:1,他引:22  
该文给出了一个XML树数据模型的形式化定义.将编码方案、逆序列表和路径索引的思想相结合,提出了一种改进的XML数据的索引结构;给出了两个实现双亲/孩子关系和拥有关系的结构连接算法,它们最多只需要对参与连接的两个列表分别进行一次扫描,并且能够根据双亲结构信息等利用Bt树索引尽可能多地跳过不需要参与连接的元素结点.实验结果表明,该文给出的基于XML索引结构实现双亲/孩子关系和拥有关系的结构连接算法是高效的、健壮的.  相似文献   

2.
XML数据分页索引技术研究   总被引:2,自引:0,他引:2       下载免费PDF全文
对海量XML文档的索引查询技术进行研究,提出一种XML数据分页索引查询实现方法。该方法把页面元素标记数量作为数据分页依据,建立XML数据的分页索引,并在该分页索引上实现XPath查询。实验结果表明,该方法能够针对不同的索引页面,采用不同的索引查询方法,有效地提高了查询效率。  相似文献   

3.
对XML数据索引的回顾   总被引:4,自引:1,他引:3  
随着Internet的迅速发展,XML已成为Internet同上数据表示与交换的事实标准.大量应用采纳了XML.例如Web Service中的数据表示和交换、MPEG7中定义的多媒体特征描述子等。目前.查询XML数据需要用XPath.由于查询语句的复杂性.很难找到一种通用的索引结构能有效支持任意查询。因此,在近十年的研究历程中.为了实现XML数据的快速查询,人们提出了大量索引结构。本文就是对已经提出的一些代表性的索引结构进行分类和总结.并指出其优缺点和所能支持的查询。  相似文献   

4.
一种改进的建立XML数据路径索引的方法   总被引:1,自引:1,他引:1  
随着XML日益普遍的应用,如何快速准确地访问XML文档中的数据已成为亟待解决的关键问题,建立路径索引是提高查询效率的一种重要手段,本文分析了可能导致路径索引复杂度过大的原因,提出了一种分步建立和更新路径索引的方法,对于具有复杂引用关系的源数据,根据查询的需要只对数据中部分路径建立索引,并通过阈值控制索引的规模,实验结果表明,本文提出的方法可以有效地降低建立和维护XML数据的路径索引的代价。  相似文献   

5.
一种改进的建立XML数据的路径索引的方法   总被引:1,自引:0,他引:1  
随着XML日益普遍的应用,如何快速准确地访问XML文档中的数据已成为亟待解决的关键问题,建立路径索引是提高查询效率的一种重要手段.本文分析了可能导致路径索引复杂度过大的原因,提出一种分步建立和更新路径索引的方法,对于具有复杂引用关系的源数据,根据查询的需要只对数据中部分路径建立索引,并通过阈值控制索引的规模.实验结果表明,本文提出的方法可以有效地降低建立和维护XML数据的路径索引的代价.  相似文献   

6.
时态XML索引技术   总被引:2,自引:0,他引:2  
叶小平  陈铠原  汤庸  汤娜  胡苏 《计算机学报》2007,30(7):1074-1085
首先通过讨论时态XML查询数据模型TXQDM,提出了基于结点有效时间的前缀编码方案.以此为基础,引入TXQDM结点间的基于时态连通的等价关系和基于时态包含的拟序关系,建立了时态XML索引数据模型TXIDM,该模型的基本特征是具有二重嵌套的索引框架,适合于TXQDM这种不规则的具有较大随意性的树形结构情形.其次,在TXIDM框架内,讨论了相应时态查询算法,其中包括基于时态的路径查询和值查询,同时,还讨论了时态索引更新算法,其中包括插入和修改算法.最后,对于文中提出的模型TXIDM和时态索引操作算法进行了性能分析且设计了相应模拟实验.实验结果表明,基于TXIDM的时态查询与更新算法是可行的和有效的.  相似文献   

7.
XML路径索引技术是XML数据管理的关键技术之一,根据构建机制的不同,XML路径索引可以分为基于XML文档内容建立的和基于XML文档模式建立的两类。随着XML在各领域中的应用,发展相对成熟的XML数据管理技术将是相关领域中数据管理的很好借鉴。对两类XML路径索引机制分别进行了研究和分析,并对XML路径索引技术在GML文档索引技术研究中的应用作出了探讨。  相似文献   

8.
XML文档的查询索引是当前研究的热点.该文探讨XML文档的索引技术,包括索引结构的设计等问题,给出了一个高效的XML索引方法,采用独特的编码方法,对XML文档及其遵循的DTD同时建立索引,有效支持内容和结构的双重检索;该方法结合了区间编码、倒排表和路径索引的思想,利用DTD结构信息来提高查询的效率.实验结果表明,本文提出的方法可以有效地降低建立XML数据索引的代价,能够缩短查询的响应时间.  相似文献   

9.
针对XML数据特有的树型结构模式,提出了一种将树型结构的XML数据和查询语句转化为特定格式的字符串,基于串匹配原理对结构复杂的XML数据进行查询的方法,避免了传统的基于路径的查询方式所必需的路径之间的连接(join)操作,从而提高查询效率。利用本文提出的编码方式,可以建立关于XML数据结构和数据内容舍为一体的索引。实验显示,本文使用的针对XML数据查询的方法比传统的基于连接操作的数据查询方式高效,且本方法具有良好的扩展性。  相似文献   

10.
基于相点分析的移动数据索引技术   总被引:2,自引:0,他引:2  
一维(有效)时间区间(VT)和二维最小限定矩形(MBR)足移动数据基本的时空单元,两者性质不同,应用中也有差异.现有移动数据查询通常足将相关数据转换为高出原空间情形"一维"的空间数据,其优势在于可充分使用现有空问数据索引技术.文中主要贡献在于研究基于过去和当前时间查询的移动数据索引模式,该索引模式能够表征时空各自特性并...  相似文献   

11.
在某大型软件系统中,采用XML来表示多种不同格式的文书和其它信息,能够大大简化系统编程接口和加快信息交流共享.XML文档处理子系统是该大型软件系统的重要组成部分,为其他子系统提供高效存储处理各种信息的统一接口.从XML文档映射模式的相关研究开始,在XML文档处理子系统的设计中提出了一种简单高效的XML文档到关系数据库的映射模式,有效提高了系统处理XML文档的速度.  相似文献   

12.
XML数据扩展前序编码的更新方法   总被引:15,自引:0,他引:15  
罗道锋  孟小峰  蒋瑜 《软件学报》2005,16(5):810-818
大部分XML查询技术都是基于某种对XML树的编码方法.对XML树的编码,是指按照某种规则对XML树的每一个结点分配唯一的编码,目的是通过任意两个结点的编码,能够直接判断两个结点之间是否具有祖先后代关系.最常用的编码方法是区域编码方法(region based numbering scheme).然而,XML数据也会面临插入删除等更新问题.数据一旦更新,区域编码也要作相应的调整,才能保证基于这个编码的各种索引和查询算法的正确性.在编码的更新方面,目前研究得还不多.主要研究区域编码的更新问题,采用预留编码空间的方法,针对不同特征的XML数据和应用环境提出了一整套预留算法和编码更新算法,并做了大量的实验,检验这些算法的有效性.  相似文献   

13.
处理路径表达式是XML查询技术中的难点和热点.在本实验室提出的XML路径表达式索引-结构化映射的基础上.为了降低构建索引所需的空间开销,本文提出了构建路径索引的代价模型,并设计了基于给定查询负载,有选择地构建路径索引的相应算法,为给定查询负载自动选择近最优索引模式(NOIS).本文还提出了当查询效率发生变化时,系统对索引模式进行自适应调整的策略.实验研究表明:使用本文方法,系统可在不影响路径表达式处理效率的前提下,大大降低路径索引的空间开销,取得查询收益和空间开销的较佳权衡.  相似文献   

14.
基于结构化联接的多版本XML文档查询处理   总被引:1,自引:0,他引:1  
结构连接是XML查询处理的核心操作,受到了研究界的关注。高效的算法是高效查询处理的关键。目前已经提出了许多结构连接的算法,但都不支持多版本的XML文档。文章对经典结构连接算法进行了扩充,使之支持多版本的XML文档。  相似文献   

15.
原生XML存储方案直接关系到查询处理和数据更新。目前的原生XML存储方案大多关注于查询处理而很少涉及对数据更新的支持。与关系表的更新不同,XML更新要考虑到节点的文档顺序。提出了一种新的原生XML存储更新机制,它既保持了节点的文档顺序,又使更新操作局限于一个页面之内,保证了更新的效率。通过引入前向链接记录和重定位记录,该更新机制使页面分裂时记录存储地址保持不变,避免了索引更新的I/O开销。通过实例说明该原生XML存储方案的数据更新机制是有效的。  相似文献   

16.
基于区域划分的XML结构连接   总被引:22,自引:7,他引:22       下载免费PDF全文
王静  孟小峰  王珊 《软件学报》2004,15(5):720-729
结构连接是XML查询处理的核心操作,受到了研究界的关注.高效的算法是高效查询处理的关键.目前已经提出了许多结构连接的算法,它们中的大多数都基于如下的前提条件之一:输入元素集合存在索引或者有序.当这些条件不成立时,由于对输入数据临时排序或建索引的代价,这些算法的性能会大大下降.基于这样的观察,提出了一种基于区域划分的结构连接算法.该算法基于任务分解的思想,利用区域编码的特点对输入集合进行划分.给出了详细的算法设计,并对算法的I/O复杂性进行了分析.大量的实验结果显示,该算法具有良好的 性能,在输入数据无序或没有索引的情况下优于现有的排序合并算法,可以为查询计划提供更多的选择.  相似文献   

17.
基于最低最小公共祖先(SLCA)的XML关键字搜索语义,提出一种使用XML结构摘要(summary)对关键字进行索引的方法XKSS.XKSS索引方法通过避免重复存储大量XML树上的含义相同的节点,大幅度降低了索引的空间耗费,并提高了查询性能.基于XKSS建立的索引,提出一个算法SSB-SLCA来计算SLCA节点.实验表明,基于XKSS的关键字搜索方法能够更高效地寻找关键字的SLCA.  相似文献   

18.
在XML文档上进行全文本检索已经成为很多研究课题的基础问题,例如Web信息检索,信息抽取等。有效的XML索引结构对于加速检索速度是至关重要的,在文献[1]的基础上全面地构建和实现了一个可以有效的支持XML全文本检索的索引结构。实验表明提出的索引结构在索引构建时间、空间等性能指标上均有很好的表现。  相似文献   

19.
郭欢  叶小平  汤庸  陈罗武 《软件学报》2012,23(8):2042-2057
研究了一种基于时态编码和线序划分的时态XML索引机制.首先,提出一种基于扩展先序编码的时态编码方案,通过该编码可确定结点间的结构关系;其次,在深入分析时间区间关系的基础上引入线序划分的概念,并讨论了获取线序划分的算法;然后,建立了整合路径结构信息和时态约束信息的时态结构摘要,并在此基础上建立了时态XML索引结构—TempSumIndex,同时研究了基于TempSumlndex的时态XML查询和增量式更新算法;最后,对TempSumlndex和现有时态XML索引技术的基本性能进行了详细的实验评估.实验结果表明,TempSumlndex具有更为优越的性能.  相似文献   

20.
Declarative XML Update Language Based on a Higher Data Model   总被引:1,自引:0,他引:1       下载免费PDF全文
With the extensive use of XML in applications over the Web, how to update XML data is becoming an important issue because the role of XML has expanded beyond traditional applications in which XML is used for information exchange and data representation over the Web. So far, several languages have been proposed for updating XML data, but they are all based on lower, so-called graph-based or tree-based data models. Update requests are thus expressed in a nonintuitive and unnatural way and update statements are too complicated to comprehend. This paper presents a novel declarative XML update language which is an extension of the XML-RL query language. Compared with other existing XML update languages, it has the following features. First, it is the only XML data manipulation language based on a higher data model. Second, this language can express complex update requests at multiple levels in a hierarchy in a simple and flat way. Third, this language directly supports the functionality of updating complex objects while all other update languages do not support these operations. Lastly, most of existing languages use rename to modify attribute and element names, which is a different way from updates on value. The proposed language modifies tag names, values, and objects in a unified way by the introduction of three kinds of logical binding variables: object variables, value variables, and name variables.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号