首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
基于DOM的XML数据库的索引技术研究   总被引:11,自引:1,他引:11  
XML作为一种数据交换的国际标准,已经贯穿于Internet应用的各个领域之中,如何快速准确地存储和查询XML数据的数据库技术是一个重要的研究课题。XML索引技术对XML数据库查询处理起着至关重要的作用,提出了基于DOM的XML数据库的索引技术(路径连接索引、值索引和引用索引),解决了传统的基于树的遍历的XML数据查询方法性能上的不足,并着重对处理含有谓词和引用关系等较复杂的查询路径的不同处理方法进行了对比和分析,还给出了索引空间利用率、查询性能和索引维护代价3个方面的标准测试结果,表明新的索引技术可以有效地提高查询处理效率。  相似文献   

2.
利用自动机高效处理XML路径表达式查询   总被引:1,自引:0,他引:1  
王国仁  于勇前  孙冰 《计算机学报》2007,30(9):1520-1532
在XML查询处理中,应用于绝大多数XML查询语言中的路径表达式在定位和查询XML数据和数据的结构关系方面具有极强的表达能力,并且由于XML数据的半结构化性,使得XML路径表达式查询的查询处理技术的研究与传统的数据库查询处理技术相比有着全新的特点和挑战.一些目前已有的查询处理技术可以用来处理路径表达式,但是查询处理中产生的大量中间结果导致了这些方法应用在大规模XML文档和复杂的路径表达式查询中时查询效率急剧下降.文中利用自动机技术设计了一个处理XML路径表达式查询的高效方法--SAM.SAM的基本思想是将路径表达式查询转化成一个与之完全等价的自动机,然后将其与从XML文档中抽象出来的模式路径相匹配.文中同时也给出了基于SAM方法的针对路径表达式中"//"操作符计算的有效解决方案.实验证明:SAM是一种非常有效的查询方法,在计算大数据量复杂路径表达式查询时具有非常高的效率,是一种实用的XML路径表达式查询方法.  相似文献   

3.
基于XML的异构数据库集成系统构架与开发   总被引:28,自引:0,他引:28  
分析了XML在解决异构数据库集成问题中的优势,并在此基础上提出了基于XML的异构数据库集成方案,实现了分布式异构数据库的透明访问和联合查询。对于架构中的主要环节给出了具体实现方法,并着重研究和验证了架构中XML与数据库模式映射、数据透明访问、联合查询处理等关键问题。  相似文献   

4.
《计算机工程》2017,(3):24-31
为解决现有原生XML数据库查询效率不高、查询并发度低、数据库规模小及可扩展性不足等问题,基于蚁群高效多用计算平台设计一个大规模分布式原生XML数据库原型系统。采用软硬协同设计思想,在硬件部分设计多并行、全流水、可配置的查询过滤结构,以实现高效查询。利用软件平台的通用性,实现数据库的灵活配置和查询结果排序、筛选等复杂处理,并针对现有原生XML,数据库存在的问题给出相应的解决方法。实验结果表明,该系统可行有效,查询效率相对于Tamino数据库有30倍左右的性能提升,并且能够支持大量并发操作,具有良好的扩展性。  相似文献   

5.
XML数据库查询语言特性研究   总被引:3,自引:1,他引:2  
XML数据库查询语言已成为构建各种XML应用的核心工具之一。目前使用的多种XML数据库查询语言尽管背景和实现形式各不相同,但在半结构化数据查询功能上都有许多相似之处。文中所论述的XML查询语言在换输出,数据集成,结构模糊查询以及在嵌套循环结构的处理等方面的共同特性,希望有助于构建更好的XML应用。  相似文献   

6.
如今对XML查询的优化是对XML的热点研究方向。其中的结构连接操作是XML数据库查询的主要操作。和关系数据库中的连接运算一样,结构连接顺序的选择是XML数据库查询优化的核心。文中主要通过对XML查询优化中各种选择连接顺序算法的研究,提出了一种优化的算法,在规模较大的XML,查询中能够有效缩减搜索空间,提高效率。  相似文献   

7.
XML模式到关系范式的映射   总被引:8,自引:0,他引:8  
虽然新一代的数据库技术如对象数据库、XML数据库等已经开始迅速发腱,但这些新技术在现阶段仍然很不成熟,因而目前对Java复杂对象以及XML数据的普遍处理办法是将其转换成关系格式以便利用目前成熟的关系数据库技术进行存储和查询。该文介绍了如何实现XML模式(DTD)到关系数据库范式的映射,由该映射得到的关系模式必须保持XML DTD的语义信息,同时是满足某种规范化约束的关系范式。  相似文献   

8.
随着XML技术研究与应用的深入,涌现出了大量XML文档.为了对XML文档进行管理和查询,大多数RDBMS扩充了处理XML数据的功能.这种方式将XML数据映射到关系表中,会破坏XML数据的树型结构.查询时,需要多次的表连接,降低了查询效率.原生XML数据库以XML文档作为基本的逻辑存储单位,建立底层的物理存储模型.提出了一种原生XML数据库的后端实现策略--XBackend,包括存储策略、索引策略、数据库恢复策略. XBackend底层存储是专门为XML数据设计的,配合适当的索引,具有更高的存储和查询效率.数据库恢复策略保证了原生XML数据库数据的一致性状态.实验结果表明XBackend具有很好的性能.  相似文献   

9.
齐金山 《福建电脑》2006,(11):130-131
XML数据本质上是一种自描述的半结构化数据,不同于以往的关系模型,现有的数据库技术和查询语言都不能用来直接处理XML数据。XQuery是W3C的一个候选标准,专门用于处理XML数据的查询。文章通过研究XQuery,设计了一种基于XQuery的通用的XML查询。  相似文献   

10.
随着语义Web技术的不断发展,基于XML的数据文档管理成为语义Web技术发展的难题,特别是RDF,DAML,OIL,OWL等本体语言的提出,基于XML的本体文档日趋复杂,传统的在关系数据库中依靠映射关系管理本体文档越来越困难。提出使用XML数据库Xindice来存储查询本体文档并设计了存储查询方法。  相似文献   

11.
张晶  张云生 《计算机工程》2007,33(10):52-54
实时数据查询技术在工业企业信息平台中具有广泛的用途,XML数据标准能够实现各子系统数据的统一描述。该文用成熟的关系数据库查询机制处理符合DTD的XML文档,提出了一整套数据模型、转换规则、算法描述,可以将XML文档转换为关系元组,从而达到用XML实现基于关系数据库的实时数据一致性描述和查询处理的目的。  相似文献   

12.
基于XML中间件的分布式数据库的数据分片策略   总被引:5,自引:1,他引:5  
XML技术由于其鬼好的数据描述能力,在数据库系统的数据交换中得到广泛应用。为了降低并行查询的困难程度和提高并行查询的准确度,提出一种基于XML的分布式数据交换中间件模型,给出了该模型的体系结构和功能定义,并根据此中间件讨论了一种分布式数据库的数据分片技术。  相似文献   

13.
Comparative Analysis of XML Compression Technologies   总被引:1,自引:0,他引:1  
XML provides flexibility in publishing and exchanging heterogeneous data on the Web. However, the language is by nature verbose and thus XML documents are usually larger in size than other specifications containing the same data content. It is natural to expect that the data size will continue to grow as XML data proliferates on the Web. The size problem of XML documents hinders the applications of XML, since it substantially increases the costs of storing, processing and exchanging the data. The hindrance is more apparent in bandwidth- and memory-limited settings such as those applications related to mobile communication. In this paper, we survey a range of recently proposed XML specific compression technologies and study their efforts and capabilities to overcome the size problem. First, by categorizing XML compression technologies into queriable and unqueriable compressors, we explain the efforts in the representative technologies that aim at utilizing the exposed structure information from the input XML documents. Second, we discuss the importance of queriable XML compressors and assess whether the compressed XML documents generated from these technologies are able to support direct querying on XML data. Finally, we present a comparative analysis of the state-of-the-art XML conscious compression technologies in terms of compression ratio, compression and decompression times, memory consumption, and query performance.  相似文献   

14.
随着Internet的普及和Web技术的快速发展,XML正迅速成为事实上的数据表示和交换标准,大量XML数据的涌现出来,为了实现XML数据的快速查询和有效的数据交换,需要将XML文档数据转存到关系数据库中。该文介绍了基于DOM的XML文档到关系数据库的数据转换方法。  相似文献   

15.
Dynamically Updating XML Data: Numbering Scheme Revisited   总被引:2,自引:0,他引:2  
Yu  Jeffrey Xu  Luo  Daofeng  Meng  Xiaofeng  Lu  Hongjun 《World Wide Web》2005,8(1):5-26
Almost all existing approaches use certain numbering scheme to encode XML elements to facilitate query processing when XML data is stored in databases. For example, under the most popular region-based numbering scheme, the starting and ending positions of an element in a document are used as the code to identify the element so that the ancestor/descendant relationship between two elements can be determined by merely examining their codes. While such numbering scheme can greatly improve query performance, renumbering large amount of elements caused by updates becomes a performance bottleneck if XML documents are frequently updated. Unfortunately, no satisfactory work has been reported for efficient update of XML data. In this paper, we first formalize the XML data update problem by defining the basic operators to support most XML update queries. We then present a new numbering scheme that not only requires minimal code-length in comparison with existing numbering schema but also improves update performance when XML data is frequently updated at arbitrary positions. The fundamental difference between our new scheme and existing ones is that, instead of maintaining the explicit codes for elements, we only store the necessary information and generate the codes when they are needed in query processing. In addition to present the basic scheme, we also discuss some optimization techniques to further reduce the update cost. Results of a comprehensive performance study are provided to show the advantages of the new scheme.  相似文献   

16.
集成Web 数据的系统框架与实现方法   总被引:5,自引:0,他引:5  
基于我们正在研究和开发的项目Panorama,本文提出了一个基于XML和CORBA的Web数据集成系统框架,该框架可以集成来自Web上多个异构的数据源,包括关系数据库、面向对象数据库,HTML和XML文档及结构化文本文件。在系统实现中,把Web看作是一个巨大的虚拟数据库,以CORBA作为分布式对象模型,以XML作为公共誓据模型,并且以XML-QL作为全局查询语言来完成Web上的数据查询和集成。文中还详细分析和描述了系统框架中的一些主要模块的实现方法,具有很好的可操作性。  相似文献   

17.
Since the Web encourages hypertext and hypermedia document authoring (e.g., HTML or XML), Web authors tend to create documents that are composed of multiple pages connected with hyperlinks. A Web document may be authored in multiple ways, such as: (1) all information in one physical page, or (2) a main page and the related information in separate linked pages. Existing Web search engines, however, return only physical pages containing keywords. We introduce the concept of information unit, which can be viewed as a logical Web document consisting of multiple physical pages as one atomic retrieval unit. We present an algorithm to efficiently retrieve information units. Our algorithm can perform progressive query processing. These functionalities are essential for information retrieval on the Web and large XML databases. We also present experimental results on synthetic graphs and real Web data  相似文献   

18.
XML数据库的并行RPE查询   总被引:1,自引:0,他引:1  
1.引言随着Internet应用的不断发展和日益普及,Internet上信息的定义和表示成为了重要的技术标准。目前,HTML标记语言由于其简单、易用等特点,已经成为广泛采用的一种标记语言。但是随着Internet上的信息量迅速地增长,在浩如烟海的信息中检索需要的内容变得越来越困难。HTML只是简单标记文档的展示格式,而不能把文档中的语义结构有效地表示出来,因而诸如Yahoo,Google等搜索引擎只能用关键字  相似文献   

19.
XML数据的查询技术   总被引:31,自引:1,他引:31  
XML规范已成为当前网络应用(包括数字图书馆、Web服务以及电子商务)中事实上的数据表达、交换的标准.针对XML数据的查询在当前XML数据管理研究中占有重要的地位,也是当前XML数据处理研究领域的热点方向,相关的研究文献有很多.根据查询模式描述的不同,将当前XML查询技术归入两大类:XML Query方式和XML IR方式.后者又进而可分以为3个子类:XML IR/keyword方式、XML IR/fragment和XML IR/query方式,并从中挑选出3个研究者关注的问题进行了简述,它们是:Twig查询模式的处理、SLCA(smallest lowest common ancestor)节点的获取以及对所获取的XML片段相似性的度量.以方便普通用户使用为准则探讨了相关XML查询技术的优、缺点,将如下4个问题作为需要进一步关注的研究内容:结构化关键字查询及相应的结构相似性度量方法,如何消除XML Query查询处理模式(包含XML IR/query)和XML IR/keyword查询处理模式间数据冗余的问题,XML Query查询方式的理论探讨及其实现以及针对特定应用的XML数据的有效管理.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号