首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
XML已经成为Internet上数据交换和数据集成的事实标准.随着XML的广泛应用,XML文档数量不断增多.如何高效地查询XML数据变得越来越重要.针对目前分支查询中普遍采用的基于堆栈的查询处理算法所存在的问题,提出了一种基于XML结构索引的模式匹配改进算法,通过选择合适的标签编码方式,利用XML结构索引,快速判断出元素之间的相互关系,防止大量不必要节点放入堆栈,从而提高查询处理效率.实验结果证明,文中改进的模式匹配算法Twig-Modify相比TwigStack以及TwigINLAB在查询处理的性能上有所提高  相似文献   

2.
半结构化数据与文本数据的异构性导致了它们的索引结构很难一致,因此在XML文档中树型结构索引和文本部分索引的联合创建与协同查询中,一般要用复杂的对应关系进行数据转换.针对这一问题,提出了一种统一的索引结构,简化了对应关系,提高了索引联合创建与协同查询的效率.  相似文献   

3.
曾一  许娴  张元平 《计算机工程》2006,32(18):64-66
XML Schema作为一种描述XML文档模式信息即结构信息的标准,对于XML索引的建立及查询效率的提高有着重要的作用。现有的大部分XML索引结构着重研究XML文档的结构查询,而对于XML文档的更新支持却不多,对无效查询也不能作出快速的判断。该文基于已有的XML文档的编码方式,提出了一种基于Schema的XML索引结构,不仅能支持基于有效性验证的动态更新,使得XML文档和XML Schema保持一致,而且对用户提出的无效的路径查询也能在较短时间内作出判断。  相似文献   

4.
XML在数据交换中的应用越来越广泛,但由于标记引入而使其空间膨胀较大,对传输及存储资源耗费严重.压缩后的XML数据容量明显减少,但怎样基于压缩后的XML数据直接进行查询及处理,仍然是需要深入研究的问题.以反向算术压缩为基本压缩算法,提出针对XML数据库中压缩XML文件的索引结构Interval ,基于该索引结构,可高效实现对类似element1element2…elmentm的查询处理.  相似文献   

5.
一种新的XML数据库的索引机制   总被引:1,自引:0,他引:1  
朱虹  童遥 《计算机工程与应用》2005,41(2):171-172,226
XML文档的路径查询通常是节点间关系的判断,其中最主要的是祖先、子孙关系的判断。该文通过借鉴R树的构造特点提出了一种新的基于R树的XML数据库的索引机制,解决了快速判断XML文档中节点间祖先、子孙关系的问题。  相似文献   

6.
一种基于DTD的XML索引方法   总被引:9,自引:0,他引:9  
路径查询是XML查询的一个主要特征,现已提出了多种XML索引方法. DTD的结构信息对于XML索引的建立及查询效率的提高很重要,但现有的大部分索引方法没有利用DTD这一有效资源.提出一种利用DTD的XML索引方法——DBXI(DTD-based XML indexing),该方法采用了新的编码方法,可使路径查询具备如下特征:对于由N个元素/属性组成的具有1个谓词约束的路径表达式,DBXI处理每个XML文档仅需0次或1次元素/属性结点集的结构连接操作;对于在XML文档中不存在匹配结构的路径查询,DBXI能够在比现有的XML索引方法较短的时间内给出无查询结果的判断.实验表明,与Lore,SphinX和XISS等索引方法相比,DBXI能够缩短路径查询的响应时间.  相似文献   

7.
提出了一种用于搜索XML文档的新的索引方法即RIST。通过采用代码化的结构序列(SES)来表示XML文档和XML查询,得出查询XML数据等同于查找子序列匹配。RIST采用树结构作为查询的基本单元,从而避免了代价高昂的连接操作。另外,RIST还在XML文档的内容和结构上提供了一个统一的索引,所以它的一个很明显的优势就是克服了仅仅根据内容或结构建立索引的弊端。实验表明RIST在支持结构查询上是一种高效的方法。  相似文献   

8.
摘要:本文提出了一种用于搜索XML文档的新的索引方法即RIST。通过采用代码化的结构序列(SES)来表示XML文档和XML查询,我们得出查询XML数据等同于查找子序列匹配。RIST采用树结构作为查询的基本单元,从而避免了代价高昂的连接操作。另外,RIST还在XML文档的内容和结构上提供了一个统一的索引,所以它的一个很明显的优势就是克服了仅仅根据内容或结构建立索引的弊端。实验表明RIST在支持结构查询上是一种高效的方法。  相似文献   

9.
ArithBi^+—一种基于反向算术压缩的XML索引结构   总被引:2,自引:0,他引:2  
XML在数据交换中的应用越来越广泛,但由于加入标记后的空间膨胀较大,对传输及存储资源耗费严重。压缩后的XML数据容量明显减少,但怎样基于压缩后的XML数据直接进行查询及处理,仍然是需要深入研究的问题。本文以反向算术压缩为基本压缩算法,提出针对XML数据库中压缩XML文件的索引结构ArithBi^+。基于该索引结构,可高效实现对类似//elenlent1/element2/…/elmentm的查询处理。  相似文献   

10.
一种支持高效XML 路径查询的自适应结构索引   总被引:1,自引:0,他引:1  
张博  耿志华  周傲英 《软件学报》2009,20(7):1812-1824
提出了一种新的自适应结构索引:AS-Index(adaptive structural index),能够克服现有静态索引和自适应索引的缺陷,具备高效的查询和调整性能.AS-Index 建立在F&B-Index 的基础之上,其索引结构包括F&B-Index,Query-Table 和Part-Table.Query-Table 能够记录频繁查询,避免了查询过程中的冗余操作.并且,在Query-Table 的基础上提出了自底向上的查询处理过程,能够充分利用现有的频繁查询高效地回答非频繁查询.Part-Table 用于优化包含祖先后裔边的查询,进一步提高了查询性能.现有的自适应结构索引的调整粒度是XML 元素节点,调整过程往往需要遍历整个文档.而AS-Index 是基于F&B-Index 节点的增量调整,其过程是局部的,高效的,并且能够支持复杂分支查询的调整.实验结果表明,AS-Index 在查询和调整性能上优于现有的XML 结构索引.同时,相比于现有的自适应结构索引,AS-Index 针对大规模文档具有更加优良的可扩展性.  相似文献   

11.
缪丰羽  王宏志 《计算机科学》2016,43(11):284-290
模糊XML文档是指包含不确定信息的XML文档。在模糊XML文档查询方面,现有的研究成果较少,并且都是基于树型结构的XML文档进行的。针对图结构下模糊XML文档的特征,设计了一组高效的图结构模糊XML文档上的模式匹配算法。该算法基于一种适合于图结构文档的索引方式,采用自底向上的结点匹配顺序,大大减少了结点的重复判断操作,也不需要进行局部匹配结果的归并以及针对PC关系设计额外的过滤函数。理论分析以及实验结果证明,提出的模式匹配算法不仅在小枝查询性能上优于现有的相关算法,而且能够较好地实现DAG模式匹配查询。  相似文献   

12.
小枝模式匹配作为XML查询的核心操作,目前在该方面已经提出了一系列有效的实现方法.在总结分析先前各种匹配算法的基础上,提出了一种新的基于路径索引的解决方法TwigFilter,该方法是一个单阶段算法,避免了路径归并.同时,考虑到通常查询中只有少数几个结点是所需的输出结果这一特点,该方法区别输出结点和其他查询结点,保证整个查询处理过程都是根据输出结点进行的.实验结果表明,该算法优于以前的算法,尤其是对查询中只有祖先-后裔关系的表达式更有效.  相似文献   

13.
高效的结构化联接方法是XML查询的关键。本文提出一种新颖的结构化联接方法,使用了包含段结构化XML文档树,并且使用了B^ -Tree索引技术支持该新方法,从而在基于栈的结构化联接过程中得以忽略若干时空耗费,提高处理效率。  相似文献   

14.
针对现存的大部分软件漏洞静态检测工具无法灵活检测用户关心的漏洞的情况,提出了一种基于模式匹配的漏洞检测方法。首先,对待测程序源码进行解析,将其转化为中间表示并存放在自定义的数据结构中;然后,用安全规则语言描述漏洞并解析安全规则,将其转换成对应的自动机模型存放在内存中;最后,将源代码的中间表示与安全规则进行模式匹配,并跟踪自动机的状态转化,根据自动机状态向用户提交漏洞报告。实验结果表明,该方法的漏报率低、扩展性好。  相似文献   

15.
一种基于XML的统一构件匹配技术   总被引:2,自引:0,他引:2  
构件检索和匹配是CBSD和软件复用的关键技术。目前构件库所采用的关键字、刻面、规约、行为等匹配技术都存在两个问题:1)构件表示方法各异,理解和共享构件困难;2)每个查询匹配算法侧重点不同,关键字和刻面匹配侧重构件的语义,而规约匹配侧重构件的结构,造成单独使用一种匹配算法或多或少产生一些冗余或无关构件。本文提出一个XML统一构件描述模型,该模型利用XML模式对构件进行层次化的组织,采用一种最大权匹配算法,从语法和语义两方面计算两个构件间的匹配度,有效地解决了上述问题。通过实验证明,该技术在保证构件查全率的基础上有效地提高了查准率。  相似文献   

16.
文章讨论了一个新的参数化尺寸标注系统的实现原理、关键技术和设计方法。该系统在以下几个方面取得明显进展,其一,基于AutoCAD的尺寸标注功能及存储格式,设计了新的通用、完整、可靠的尺寸标注系统,为AutoCAD增添了新的标注功能,使其能够准确地标注国家机械制图标准所规定的尺寸标注模式。其二,归纳了AutoCAD和国家标准的各种尺寸标注模式,借助于模式匹配及其推理,自动标注不同类型的尺寸标注,实现了智能化尺寸标注功能。其三,尺寸标注变量及其约束表达式功能,在参数化模型图的参数编辑、尺寸驱动和尺寸标注图素自动生成方面显示出极大的效率。  相似文献   

17.
在分析现有的频繁模式树挖掘的经典算法FREQT和FreqtTree基础上,提出一种新的基于递推式右路径扩展的XML频繁模式树挖掘算法。该算法采用最右路径扩展的思想,利用递推式的候选节点集更新技术来压缩候选节点集,产生数量较少的候选模式,并且在计算候选模式树的支持数时,采用增量式技术,提高算法效率。从理论上证明该算法的正确性,并对通过具体实验验证算法的高效性。  相似文献   

18.
基于后缀树的带有通配符的模式匹配研究   总被引:1,自引:1,他引:0  
由于在生物序列分析、文本索引、网络入侵检测等领域的应用需求,带有通配符的模式匹配问题一直是研究 的热点。针对已有的研究工作中通配符和长度约束具有较强的局限性问题,研究带有灵活通配符的模式匹配问题,其 中通配符可以在模式的任意两子串间出现且可以指定灵活的长度约束。采用非线性数据结构—后缀树,设计了求 解模式所有解的完备算法PAS"I'。预处理阶段采用在线增量式算法构建具有文本先验知识的后缀树,搜索阶段结合 动态规划的思想,逐个匹配模式中字符,最终得到完备解。在基因序列上的实验表明,PAST比其他算法具有更好的 时间性能。  相似文献   

19.
XML查询语言当中,包含通配符*的查询能够方便有效地满足一些特殊查询要求,但在大数据时代下XML文件容量与结构复杂性不断增加,现有支持通配符查询的算法需消耗巨量内存来解析XML,并且在对嵌套通配符处理时需要大量的单路径匹配操作和局部结果的缓存。针对此现状,结合现有经典算法,提出一种新的、能够高效解决小枝模式当中含有通配符*的查询算法-WTwigList。该算法首先对查询模式进行通配符的层次关系处理,减少不必要的通配符匹配,以数据流形式解析XML文件并执行局部的扩展Dewey编码,经过滤操作后得到有序的叶子节点编码列表,在列表中执行匹配操作得到结果;其次在真实和合成数据集上做大量实验,结果表明WTwigList算法与现有算法相比,能够有效提高查询效率,在空间效率上具有一定优势,且能够快速准确地处理查询模式中P C关系。  相似文献   

20.
一种新的基于B+树结构索引的XML元素的连接算法   总被引:1,自引:0,他引:1  
该文通过对传统的NumberingSchema进行改进,并结合B+树提出了一种新的索引———B+树结构索引。在B+树结构索引的基础上提出了一种有效的连接算法,该算法通过削减不参加连接的元素来实现快速、有效的连接。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号