首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
基于Schema的XML索引方法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
针对XML文档路径查询中无效扫描量大、分支路径连接操作复杂等问题,提出一种基于Schema的XML索引方法。通过Schema与查询路径匹配,确定需要扫描的XML文档。利用编码方法减少结点连接次数。实验结果表明,该方法较已有索引方法有更高的查询效率,具有较好的实用性及可扩展性。  相似文献   

2.
首先对XML文档的编码方式作了改进,提出了用浮点数对插入子树进行编码的方法,新的编码方法能较好地支持XML文档的插入更新,在此基础上提出了支持多版本XML文档的新的索引机制,最后扩展了一个经典的结构化连接算法使之不仅能支持多版本XML文档的查询,而且还能较好地避免连接过程中的冗余操作.对XML的版本管理,尤其是在索引和查询优化方面提供了一些新的思路.  相似文献   

3.
论文基于XML Schema规范,提出了一种等价于XML Schema的数据模型是New_Schema,并实现了从New_Schema到关系模式的映射算法。实验证明,在XML文档的模式信息比较稳定的情况下,New_Schema映射方法在数据转储过程中的信息保持、映射后的查询更新操作要优于文本、Xparent和DTD等方法。  相似文献   

4.
在关键字查询领域,目前提出的大多数索引结构主要考虑的是静态的XML文档.当XML文档出现频繁更新时,这些索引结构可能面临着大范围的重新编码,从而增加了数据库索引维护的代价.为了能在XML文档动态更新的环境下保持其索引结构的稳定,提出了一种支持动态XML文档上关键字查询的索引结构DLSS( DDE Level Structure Summary).该索引结构采用了一种针对动态更新改进的Dewey编码,该编码只需在文档更新时对新的节点赋予相应的编码,而不需要调整原有的编码结构.实验证明,DLSS索引结构可以在XML文档频繁更新或者较少更新时都能保持索引结构的相对稳定,并能在其上实现较高的关键字查询效率.  相似文献   

5.
随着XML应用的不断扩展,XML数据容量越来越庞大.为了更加快捷有效地在大容量XML数据上进行查询,很多研究工作集中在XQuery的查询代价评估上.提出了一种基于XML Schema的XML概要树,(XML Schema based XML synopsis tree, XSS).XSS基于XML Schema生成,保存有XML文档的结构信息和节点数目统计信息.基于XSS可以高效地进行XQuery的查询代价评估,进而为XML查询优化服务.相关实验验证了在XSS上进行XQuery查询代价评估的高效性和准确性.  相似文献   

6.
本文根据W3C最新提出的XML Schema规范,提出了一种等价于XML Schema的数据模型S_Schema.并实现了S_Schema到关系模式的生成算法和XML文档到关系数据库的加裁算法。实验证明,S_Schema方法在数据转储过程中的信息保持、映射后的查询更新操作等方面的综合性能要优于文本、Xparent方法。  相似文献   

7.
提出了一种用于搜索XML文档的新的索引方法即RIST。通过采用代码化的结构序列(SES)来表示XML文档和XML查询,得出查询XML数据等同于查找子序列匹配。RIST采用树结构作为查询的基本单元,从而避免了代价高昂的连接操作。另外,RIST还在XML文档的内容和结构上提供了一个统一的索引,所以它的一个很明显的优势就是克服了仅仅根据内容或结构建立索引的弊端。实验表明RIST在支持结构查询上是一种高效的方法。  相似文献   

8.
缪丰羽  王宏志 《计算机科学》2016,43(11):284-290
模糊XML文档是指包含不确定信息的XML文档。在模糊XML文档查询方面,现有的研究成果较少,并且都是基于树型结构的XML文档进行的。针对图结构下模糊XML文档的特征,设计了一组高效的图结构模糊XML文档上的模式匹配算法。该算法基于一种适合于图结构文档的索引方式,采用自底向上的结点匹配顺序,大大减少了结点的重复判断操作,也不需要进行局部匹配结果的归并以及针对PC关系设计额外的过滤函数。理论分析以及实验结果证明,提出的模式匹配算法不仅在小枝查询性能上优于现有的相关算法,而且能够较好地实现DAG模式匹配查询。  相似文献   

9.
摘要:本文提出了一种用于搜索XML文档的新的索引方法即RIST。通过采用代码化的结构序列(SES)来表示XML文档和XML查询,我们得出查询XML数据等同于查找子序列匹配。RIST采用树结构作为查询的基本单元,从而避免了代价高昂的连接操作。另外,RIST还在XML文档的内容和结构上提供了一个统一的索引,所以它的一个很明显的优势就是克服了仅仅根据内容或结构建立索引的弊端。实验表明RIST在支持结构查询上是一种高效的方法。  相似文献   

10.
目前大部分前缀编码方案都不能很好的支持XML文档的数据更新.提出的前缀编码方案不仅能高效地支持结构查询,快速准确的判断XML文档结构树中任意两个结点之间的父子、先后代以及兄弟关系,而且对插入的结点采用新的编码规则,避免了更新操作带来的编码调整问题,能有效支持XML文档更新.  相似文献   

11.
为提高XML文档的查询效率,提出一种基于倒排表与B+树的联合索引技术。DTD结构索引和内容索引采用倒排表作为索引单位,XML文档索引使用B+树作为索引基本组织。在DTD结构索引的结点编码中设置标识信息,便于确定需要查询的文档。通过建立DTD结构索引、XML文档索引和内容索引,实现混合型XML文档的查询。理论分析与实验结果表明,该技术具有较小的空间开销和较高的查询效率。  相似文献   

12.
XML文档的查询索引是当前研究的热点.该文探讨XML文档的索引技术,包括索引结构的设计等问题,给出了一个高效的XML索引方法,采用独特的编码方法,对XML文档及其遵循的DTD同时建立索引,有效支持内容和结构的双重检索;该方法结合了区间编码、倒排表和路径索引的思想,利用DTD结构信息来提高查询的效率.实验结果表明,本文提出的方法可以有效地降低建立XML数据索引的代价,能够缩短查询的响应时间.  相似文献   

13.
Temporal XML: modeling, indexing, and query processing   总被引:1,自引:0,他引:1  
In this paper we address the problem of modeling and implementing temporal data in XML. We propose a data model for tracking historical information in an XML document and for recovering the state of the document as of any given time. We study the temporal constraints imposed by the data model, and present algorithms for validating a temporal XML document against these constraints, along with methods for fixing inconsistent documents. In addition, we discuss different ways of mapping the abstract representation into a temporal XML document, and introduce TXPath, a temporal XML query language that extends XPath 2.0. In the second part of the paper, we present our approach for summarizing and indexing temporal XML documents. In particular we show that by indexing continuous paths, i.e., paths that are valid continuously during a certain interval in a temporal XML graph, we can dramatically increase query performance. To achieve this, we introduce a new class of summaries, denoted TSummary, that adds the time dimension to the well-known path summarization schemes. Within this framework, we present two new summaries: LCP and Interval summaries. The indexing scheme, denoted TempIndex, integrates these summaries with additional data structures. We give a query processing strategy based on TempIndex and a type of ancestor-descendant encoding, denoted temporal interval encoding. We present a persistent implementation of TempIndex, and a comparison against a system based on a non-temporal path index, and one based on DOM. Finally, we sketch a language for updates, and show that the cost of updating the index is compatible with real-world requirements.  相似文献   

14.
XML强闭包依赖的研究   总被引:5,自引:2,他引:3  
殷丽凤  郝忠孝 《计算机科学》2008,35(11):195-198
XML闭包依赖是基本的完整性约束。当XML文档出现不完全信息时,XML闭包依赖同样对于阻止XML数据的更新异常、查询优化以及索引设计具有重要的意义。提出了在不完全信息环境下基于一致路径集合的XML强函数依赖和XML强闭包依赖的定义,研究了XML强闭包依赖的判定定理。在提出XML强闭包依赖推理规则的基础上,对其有效性和完备性进行了证明。最后分析了XML强闭包依赖和XML强函数依赖的关系。  相似文献   

15.
为了实现对XML文档的数据更新,提出一组实用算法。该算法利用简单应用编程接口扩展标记语言(SAX)解析和文件对象模型(DOM)解析,使其优势互补。应用SAX解析器将大XML文档编码成线性数据结构存储,该线性数据结构与原XML文档具有同构特性,因此,线性结构存储的数据可以无损还原为原XML文档。线性数据结构支持Xpath查询,在查询得到的局部数据上应用DOM方法进行数据更新。更新后的数据再转换为XML文档。该组算法对大XML文档的数据更新实用且有效,而且对大XML文档的其他数据处理也有一定的实用价值。  相似文献   

16.
XML模式验证作为处理XML数据的前提和保证有着重要的地位,XML Schema作为XML的定义语言,其本身并不能保证XML数据的有效性.利用XML Schema抽象模型,定义了XML Schema中每个复杂类型的模式信息,并用非终节点序对集描述XML文档,最后给出了XML模式验证算法,可以有效地验证XML文档的组织结构和内容类型.  相似文献   

17.
面向方面XML查询技术   总被引:1,自引:0,他引:1  
提出一种有效的方法对XML文档进行描述,解决原有方法中改变XML文档结点时需要对XML文档结点进行重新编码,并改进结构连接查询效率.提出利用面向方面编程方式对XML文档进行定义.在XML文档定义中引入织入,并通过实现对XML Schema的扩充,使XML文档定义具有面向方面编程技术的功能,给出相关结构连接算法.方法避免了由于扩充XML文档而对结点重新编码,减少了修改结点信息的次数,提高文档的重用性.提供了不同织入文档情况下的实验结果,比较不同结构连接算法的性能,实验结果表明该文工作有意义.  相似文献   

18.
针对XML文档索引查询中非法路径查询响应时问过长的问题,提出一种利用DTD模式进行预处理的索引方法。建立索引DWBI,采用新的基十区域编码方式,有效地支持祖先一后代判断。查询时利用DTD模式对查询进行预处理,再查询带有DTD信息的XML索引树,从而提高查询的效率。  相似文献   

19.
基于XML Schema的XML存储   总被引:6,自引:0,他引:6  
郝春辉  邹静 《计算机工程与应用》2006,42(11):173-175,204
文章介绍了一个在关系数据库中,基于XMLSchema的XML存储方案。描述了一个以树模型为模型,XMLSchema为模式的XML数据库的存储系统。首先给出了在关系数据库中存储XMLSchema的方法,在此基础上,又给出了存储XML文档的方法。与通常的XML分解存储方案不同之处在于,在该方案中,XMLSchema被保存到数据库中,未作模式映射,避免了模式映射通常会带来的数据丢失和数据要分散到多个关系表中的问题;对XML文档的存储和查询都是基于XMLSchema的;并且由于所有基于同一个模式的XML文档共享该模式的结构,不必对结构信息进行重复存储,减少了存储空间;最后,由于我们为每一个元素赋予了一个唯一ID值,在进行查询的时候,可以利用该ID值进行定位,具有和XPath表达式相同的作用,但是更为简便。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号