首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
一种XML文档索引及查询处理方式   总被引:3,自引:0,他引:3  
本文首先论述了传统XML路径模式索引方式,在此基础上提出面向元素的XML文档索引方式和相关算法,以及使用扩展的后序遍历序号进行元素节点标识的方案,并给出了该索引方式和元素节点标识方案下规则路径表达式查询和树型模式查询处理的方法,最后说明该方式在效率上优于传统索引方式下规则路径表达式查询和树型模式查询处理。  相似文献   

2.
一种基于DTD的XML索引方法   总被引:9,自引:0,他引:9  
路径查询是XML查询的一个主要特征,现已提出了多种XML索引方法.DTD的结构信息对于XML索引的建立及查询效率的提高很重要,但现有的大部分索引方法没有利用DTD这一有效资源,提出一种利用DTD的XML索引方法——DBXI(DTD-based XML indexing),该方法采用了新的编码方法,可使路径查询具备如下特征:对于由N个元素/属性组成的具有1个谓词约束的路径表达式,DBXI处理每个XML文档仅需0次或1次元素/属性结点集的结构连接操作;对于在XML文档中不存在匹配结构的路径查询,DBXI能够在比现有的XML索引方法较短的时间内给出无查询结果的判断.实验表明,与Lore,SphinX和XISS等索引方法相比,DBXI能够缩短路径查询的响应时间.  相似文献   

3.
研究了数据库查询优化问题,而XISS索引是XML数据库索引中支持正则路径表达式的典型代表。XISS索引对于长查询路径表达式,要产生大量中间结果,连接操作代价十分高,加大了查询的时间和空间复杂度,导致查询的效率和准确率低。为了提高XML数据库查询效率和准确率,提出一种改进的XISS索引技术。首先引入DTD模式信息,简化编码方式;然后对节点索引结构进行改进,减少中间结果的连接次数,使得查询时间与路径长度无关,提高了查询效率和准确率。最后通过实验对改进前后的XISS索引进行仿真。结果表明,改进的XISS索引缩短了建立索引的时间,加快了查询响应的速度,提高了XML数据库查询的效率和准确率。  相似文献   

4.
在各种XML查询语言中普遍采用路径表达式来表示对象间的嵌套和引用关系,路径表达式的求解是查询处理中的一个关键问题.本文提出一种基于路径索引与编码模式的路径连接方法,利用路径索引能够以与路径长度成比例的时间求出对象的后代或祖先的目标集,利用编码模式则可以用常数时间确定对象之间的祖先一后代关系.实验结果表明,本文提出的方法具有较高的效率,当对大量对象进行连接以及当路径的长度、路径上结点的出度或入度较大时,本文提出的方法明显优干自顶向下或自底向上遍历的方法。  相似文献   

5.
路径索引是改善原生XML数据库(NXD)性能的一项重要技术.然而现有NXD中的路径索引缺乏动态性、白适应性,妨碍了NXD的查询性能改善.本文根据Chung C等提出的面向XML数据的自适应路径索引(APEX)[1],结合NXD的特点,提出面向NXD的自适应路径索引(NXD.APEX).NXD.APEX继承了APEX自适应性,并通过加入时间特征到APEX的常用路径挖掘算法中,使NXD-APEX能有效处理具有时间局部性的查询.同时针对NXD-APEX可能导致的大空间开销问题,提出一种基于收益的索引筛选算法.试验表明:NXD-APEX能以合理的空间开销有效地改善NXD的查询性能.  相似文献   

6.
随着XML逐渐成为Internet数据表示与交换的标准,如何快速准确地访问XML文档中的数据已成为亟待解决的关键问题,建立路径索引是提高查询效率的一种重要手段.本文设计了一种基于PATRICIA-TRIES的路径索引,简称PT索引.该索引有如下特点:一、基于PATRICIA-TRIES结构,实现快速检索.二、采用压缩编码能够将路径索引放入内存,三、索引含有结构和文本信息,通过查询索引就能提供结果,无需打开原文档.其后,分析了PT索引的时间和空间复杂性,并与三种的典型的索引结构进行了对比实验,结果证明了其在路径查询方面具有更高的效率.  相似文献   

7.
基于DOM的XML数据库的索引技术研究   总被引:11,自引:1,他引:11  
XML作为一种数据交换的国际标准,已经贯穿于Internet应用的各个领域之中,如何快速准确地存储和查询XML数据的数据库技术是一个重要的研究课题。XML索引技术对XML数据库查询处理起着至关重要的作用,提出了基于DOM的XML数据库的索引技术(路径连接索引、值索引和引用索引),解决了传统的基于树的遍历的XML数据查询方法性能上的不足,并着重对处理含有谓词和引用关系等较复杂的查询路径的不同处理方法进行了对比和分析,还给出了索引空间利用率、查询性能和索引维护代价3个方面的标准测试结果,表明新的索引技术可以有效地提高查询处理效率。  相似文献   

8.
为快速准确地查询图结构XML文档,本文在互关联后继树(IRST)的基础上,引入结构索引的相似性归并思想,提出一种基于互关联后继树且支持分支路径查询的高效XML结构索引-IRST(k,l)-index,并给出该索引的快速创建和查询算法.经实验验证,与国际上同类索引相比,该索引的创建速度更快、查询效率更高、空间开销更小.  相似文献   

9.
建立高效的索引来快速定位满足要求的节点是提高XML数据查询效率的一个必要手段.文中以降低复杂度和提高查询效率为目标,以基于路径的XML索引原理为基础,提出了一种新型的基于Dewey编码的索引结构RTL-Index.RTL-Index通过对文档节点编码来表示结构信息,利用前缀路径匹配操作完成结构查询,支持含通配符" 和后代轴"//"的查询以及兄弟节点无序的模式树的查询.仿真实验结果表明RTL-Index索引具有较低的时间和空间复杂度,解决了XML文档分支路径查找问题,是一种较为有效的XML索引结构.  相似文献   

10.
针对XML的相对路径查询及引用路径查询问题,提出了一种面向XML数据的路径分块索引KI。探讨了KI索引构造方法、索引节点分裂算法和相关查询处理的算法,并用VC++实现,利用Shakespeare和Xorder数据集进行了XML查询测试,实验结果表明,提出的KI索引能有效地提高XML查询效率。  相似文献   

11.
论文结合网格索引和R树索引的特点,提出了一种基于粗分网格和聚类R树的混合索引方案(HSIBGR)。该方案首先将矩形地理空间进行粗网格划分建立一级索引,然后针对每个小网格建立基于R树的二级索引,采用聚类技术处理溢出R树结点的分裂。论文还对HSIBGR索引机制进行了理论分析和实验验证,结果表明HSIBGR索引机制能有效地减少存储开销,提高检索效率,具有良好的性能。  相似文献   

12.
分别概述了微波极化指数、散射指数以及土壤湿度指数等被动微波遥感指数的发展及其应用。37GHz的微波极化差指数△T37(△T37=TB37V—TB37H)和极化比指数(MPDI=C*(TB37V—TB37H)/(TB37V+TB37H))被认为是监测植被状况的微波植被指数,利用GAME—Tibet1998IOP数据计算和分析了青藏高原中部5个试验站点6~9月的平均△T37值和MPDI值的变化情况。结果表明:ANDUO和MS3608的平均值在15K左右,表现出裸土的微波辐射特征;总体上5个站点的MPDI随时间的变化不大,也即在1998年6~9月间,各个站点的植被状况变化不大;而站间的差别比较大,也即各个站点的植被状况有较大的差别;ANDUO的MPDI表现出规律性的变化,即在6至9月的变化中,8月份的MPDI最小,对应植被最好的月份;对研究区的MPDI和相应时间的MSAVI(可见/近红外数据得到的修改型土壤调整植被指数)的空间分布图进行了比较,二者基本吻合。  相似文献   

13.
面向对象数据库的索引技术   总被引:5,自引:0,他引:5       下载免费PDF全文
本文研究类层次索引、嵌套索引、路径索引和多重索引,并给出相应的索引维护算法。  相似文献   

14.
本文介绍了现有的对影像数据管理和索引的方法及其存在的不足,提出了一种基于非均匀划分思想对分布式影像数据进行管理和索引的方法,避免了由于边缘补零带来的时间和空间开销。实验结果表明,本文方法能够支持对分布式多图幅的联合查询以及结果的无缝拼接,而且其时间和空间代价远小于现有方法。  相似文献   

15.
利用一种简单直观的一个改进的拓扑指数D,路径指数P2和位置指数S来表征多烷基苯的分子结构,并建立了多烷基苯的沸点与其分子结构之间的定量关系式。拓扑指数的相关性良好,对各种多烷基苯及其异构体的沸点的预测结果与文献值一致性令人满意。  相似文献   

16.
针对分布式存储系统上使用非主键访问数据带来的性能问题,探讨在分布式存储系统上实现索引的相关关键技术。在充分分析分布式存储特征的基础上,提出了分布式索引设计和实现的关键点,并结合分布式存储系统的特点及相关的索引技术,讨论了索引的组织形式、索引的维护和数据一致性等问题;然后基于如上的分析,选择在分布式数据库系统OceanBase开源版本上,设计和实现分布式索引机制,并通过基准测试工具YCSB进行性能测试。实验结果表明,虽然辅助索引会对系统性能产生影响,但因为充分考虑了系统特征及存储特点,在不同数据规模下,该索引都能够将性能影响控制在5%以内。另外,使用冗余列的方式,能进一步将该索引的性能提升100%。  相似文献   

17.
Oracle数据库应用系统的性能优化是一项系统化的工程,涉及到数据库结构的各个方面。本文从B*树索引入手,分析了B*树索引的结构及原理,阐明了如何正确合理地使用B*树索引及其如何优化数据库系统的性能。  相似文献   

18.
Huang and Liu [Generalized scrambling indices of primitive a digraph, Linear Algebra Appl. 433 (2010), pp. 1798–1808] gave the definitions of the generalized μ-scrambling indices and the generalized scrambling indices of a primitive digraph and also provided some exact lower and upper bounds for the generalized scrambling indices of various classes of primitive digraphs. In this paper, we give some exact lower and upper bounds for the generalized μ-scrambling indices of various classes of primitive digraphs.  相似文献   

19.
Intense regulatory focus on secure retention of electronic records has led to a need to ensure that records are trustworthy, i.e., able to provide irrefutable proof and accurate details of past events. In this paper, we analyze the requirements for a trustworthy index to support keyword-based search queries. We argue that trustworthy index entries must be durable—the index must be updated when new documents arrive, and not periodically deleted and rebuilt. To this end, we propose a scheme for efficiently updating an inverted index, based on judicious merging of the posting lists of terms. Through extensive simulations and experiments with two real world data sets and workloads, we demonstrate that the scheme achieves online update speed while maintaining good query performance. We also present and evaluate jump indexes, a novel trustworthy and efficient index for join operations on posting lists for multi-keyword queries. Jump indexes support insert, lookup and range queries in time logarithmic in the number of indexed documents.  相似文献   

20.
基于动态文档集的索引技术*   总被引:1,自引:0,他引:1  
倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据越来越大。同时特定的应用领域如新闻搜索、桌面搜索等对实时更新性能要求较高,这需要使用有效的索引更新策略,也称动态索引。描述了常用的动态索引技术,并详细分析了其使用代价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号