首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于索引的XML查询技术研究   总被引:2,自引:0,他引:2  
介绍了目前XML数据查询技术的研究现状,对主要的XML索引查询技术作了较深入的探讨,其中包括:基于路径索引的XML查询方法,如DataGuide、1-index、A(k)索引等;基于编码的XML索引查询方法,如Anc_Desc_B^+、XR树+XR-Stack算法等。文中对相关XML索引查询方法的优点和不足进行了分析。  相似文献   

2.
一种支持高效XML 路径查询的自适应结构索引   总被引:1,自引:0,他引:1  
张博  耿志华  周傲英 《软件学报》2009,20(7):1812-1824
提出了一种新的自适应结构索引:AS-Index(adaptive structural index),能够克服现有静态索引和自适应索引的缺陷,具备高效的查询和调整性能.AS-Index 建立在F&B-Index 的基础之上,其索引结构包括F&B-Index,Query-Table 和Part-Table.Query-Table 能够记录频繁查询,避免了查询过程中的冗余操作.并且,在Query-Table 的基础上提出了自底向上的查询处理过程,能够充分利用现有的频繁查询高效地回答非频繁查询.Part-Table 用于优化包含祖先后裔边的查询,进一步提高了查询性能.现有的自适应结构索引的调整粒度是XML 元素节点,调整过程往往需要遍历整个文档.而AS-Index 是基于F&B-Index 节点的增量调整,其过程是局部的,高效的,并且能够支持复杂分支查询的调整.实验结果表明,AS-Index 在查询和调整性能上优于现有的XML 结构索引.同时,相比于现有的自适应结构索引,AS-Index 针对大规模文档具有更加优良的可扩展性.  相似文献   

3.
林馨  任仲晟 《福建电脑》2008,24(9):118-119
XML文档是一种很好地描述了带层次结构的文本内容的半结构化数据,广泛地应用在互联网上。已逐渐成为互联网上数据交换的标准。传统的基于关键词的搜索引擎不能充分利用文档的结构信息.无法胜任基于XML元素粒度的搜索。本文利用XML文档的DTD结构,提出了一种新的适用于XML文档信息检索的索引结构。并在此基础上,给出了XPath查询处理过程。  相似文献   

4.
对XML数据索引的回顾   总被引:4,自引:1,他引:3  
随着Internet的迅速发展,XML已成为Internet同上数据表示与交换的事实标准.大量应用采纳了XML.例如Web Service中的数据表示和交换、MPEG7中定义的多媒体特征描述子等。目前.查询XML数据需要用XPath.由于查询语句的复杂性.很难找到一种通用的索引结构能有效支持任意查询。因此,在近十年的研究历程中.为了实现XML数据的快速查询,人们提出了大量索引结构。本文就是对已经提出的一些代表性的索引结构进行分类和总结.并指出其优缺点和所能支持的查询。  相似文献   

5.
XML文档的查询索引是当前研究的热点.该文探讨XML文档的索引技术,包括索引结构的设计等问题,给出了一个高效的XML索引方法,采用独特的编码方法,对XML文档及其遵循的DTD同时建立索引,有效支持内容和结构的双重检索;该方法结合了区间编码、倒排表和路径索引的思想,利用DTD结构信息来提高查询的效率.实验结果表明,本文提出的方法可以有效地降低建立XML数据索引的代价,能够缩短查询的响应时间.  相似文献   

6.
XML数据分页索引技术研究   总被引:2,自引:0,他引:2       下载免费PDF全文
对海量XML文档的索引查询技术进行研究,提出一种XML数据分页索引查询实现方法。该方法把页面元素标记数量作为数据分页依据,建立XML数据的分页索引,并在该分页索引上实现XPath查询。实验结果表明,该方法能够针对不同的索引页面,采用不同的索引查询方法,有效地提高了查询效率。  相似文献   

7.
使用RDBMS的XML文档的扩展倒排索引技术   总被引:1,自引:0,他引:1  
胡光 《计算机工程》2005,31(3):99-101
倒排索引是目前检索领域广泛应用的一种技术,但要对XML文档实现包含查询,该技术还需要改进。该文提出了一种扩展倒排索引技术以处理包含查询,通过实验与以前的方法比较证明了它的有效性。该方法可以不对RDBMS做任何改动,应用在RDBMS中实现处理包含查询能够得到与IR实现一致的效果。  相似文献   

8.
充分利用XML数据库文档的树形结构特性,结合Dewey编码原理和B+树的索引特性,提出了一种基于B+树的加密XML结构索引和查询模型.在XML文档加密过程中,将XML加密数据与基于加密数据的B+树索引一起存储在服务器端,以便在服务器端完成对加密数据的结构索引.实验结果表明,此法提高了查询的效率,无需解密无关的加密数据,有效地实现了对加密XML数据的结构索引.  相似文献   

9.
面向XML文档的概念检索技术   总被引:11,自引:1,他引:11  
孙登峰 《计算机应用》2003,23(1):110-112
面向XML文档的信息检索是一个重要的研究课题,文中介绍了结构化文档的结构索引以及语义检索中的“上下文共现分析”技术,并在此基础上提出了一个面向XML文档的概念检索原型系统,并对系统设计及实现中应注意考虑的几个主要问题进行了分析。  相似文献   

10.
一种高效的XML路径查询索引   总被引:1,自引:0,他引:1       下载免费PDF全文
XML文档的查询索引是当前研究的热点。提出一种高效的XML路径查询索引KDXI,首先对XML文档进行编码,然后建立结构索引并对结构索引进行编码。研究了基于KDXI索引结构的半结构连接算法和路径查询处理过程。通过KDXI索引机制,可以有效执行一般的路径查询语句,并避免冗余的结构连接操作。实验证明了KDXI索引机制的优越性。  相似文献   

11.
Web智能信息检索体系结构的研究   总被引:3,自引:0,他引:3  
利用XML建立了基于领域模型的Web信息集成系统 ,对Web信息进行了分割、组织和管理 ,并参考公共对象请求代理结构CORBA ,集成XML和移动Agent技术的优势 ,构造了一个Web智能信息检索体系结构。它不仅适合Web发展的需要 ,同时为用户获取网络信息提供了一种有效的方法。  相似文献   

12.
Nesting and Defoliation of Index Expressions for Information Retrieval   总被引:1,自引:0,他引:1  
In this article, a formalisation of index expressions is presented. Index expressions are more expressive than keywords while maintaining a comprehensible complexity. Index expressions are well-known in Information Retrieval (IR), where they are used for characterising document contents, formulation of user interests, and matching mechanisms. In addition, index expressions have found both practical and theoretical applicability in 2-level hypermedia systems for IR. In these applications, properties of (the structure of) index expressions are heavily relied upon. However, the presupposed mathematical formalisation of index expressions and their properties still lacks. Our formalism is based on the structural notation of index expressions. It is complete in the sense that several notions of subexpressions and defoliation of index expressions are also formalised. Defoliation, which plays an important role in defining properties of index expressions, is provided as a recursively defined operator. Finally, two other representational formalisms for index expressions are compared to ours. Received 9 July 1998 / Revised 20 April 1999 / Accepted in revised form 28 May 1999  相似文献   

13.
基于语义的Web信息检索   总被引:4,自引:0,他引:4  
提出了基于语义的信息检索原型系统,通过建立在本体论基础上的语义分析和逻辑推理,初步实现了人机语义交互,使得计算机能够理解用户的查询意图,明确信息需求,不但可以保证信息检索的查全率,而且可以有效提高查准率,查询结果更加合理可用。  相似文献   

14.
利用人工和自动生成的资源进行中文信息检索查询扩展   总被引:4,自引:0,他引:4  
在中文信息检索的研究和实践中,由于查询与文件集中词的不匹配现象导致一些相关的文件不能被成功地检索出来,这是影响检索效果的一个很关键的问题。该文提出并实现了利用人工和自动生成的资源进行中文信息检索查询扩展,在NTCIR-2中文信息检索测试集上进行的实验表明,相对于不进行查询扩展的检索结果,该扩展方法取得了具有统计意义提高的检索效果。  相似文献   

15.
传统的邻近性检索模型同等地看待所有查询词,不加区分地考虑所有查询词的邻近性,造成“平行概念效应”,影响邻近性检索方法的性能。文中提出一种查询词相似度加权的邻近性检索方法。该方法根据查询词之间的语义相似度对查询词邻近性统计量加权,可进一步推断用户的实际信息需求,挖掘查询中蕴含的更深层次的信息。实验结果表明,在短查询较多的应用环境下,文中方法可较显著提升传统邻近性检索模型的性能,有效规避查询词邻近性的平行概念效应。  相似文献   

16.
文本检索会议(TextREtrievalConference,TREC)是目前国际上信息检索领域最重要的学术交流与系统评测活动。会议为参加者提供标准的数据集合、评测问题和标准答案,从而使参加者以共同的标准进行系统运行和评测。作者代表中国科学院参加了文本检索会议的WEB信息检索任务。在TREC2002中,作者发现了适合不同数据集合的较高性能的内容检索算法,并综合考虑了文本内容、链接文字、文档结构等因素对WEB信息检索效果的影响,取得了较好的成绩。该方法在两届会议的不同任务中均表现了较高的性能。  相似文献   

17.
汪强 《电脑学习》2009,(2):14-15
索引是对数据库表中一列或多列的值进行排序的一种结构。如何合理地使用索引。以及使用索引时应注意的事项.都是本文讨论的问题。并为数据库设计者提供很好的参考。  相似文献   

18.
信息检索与信息抽取技术的研究   总被引:15,自引:1,他引:15  
在当今信息社会 ,人们对于信息获取的要求越来越高。特别是互联网的普及 ,可以很方便地从互联网上获取信息。然而目前的信息检索技术和信息抽取技术还远远不能满足人们的要求。首先介绍信息检索和信息抽取技术 ,然后分析两者的特点和不足 ,最后提出一个结合两者优势的信息获取模型  相似文献   

19.
基于标记树对象抽取技术的Hidden Web获取研究   总被引:6,自引:0,他引:6  
目前标准的搜索引擎能够检索的仅仅是WorldWideWeb提供的小部分称为可索引的Web信息。大量的HiddenWeb信息(估计容量是可索引Web的500倍)对这些搜索引擎是不可见的。这些信息隐藏在Web页面的搜索表单后面,保存在大型的动态数据库中。该文提出了一套检索HiddenWeb信息的方法,给出了系统的框架结构,并详细讨论了实现的关键技术。系统采用新的基于标记树的对象抽取(Tag-Tree-basedObjectExtraction)方法自动地从Web页面中抽取HiddenWeb信息,然后在此基础上给出了结构化的HiddenWeb信息查询算法。文章最后对实验结果进行了讨论。  相似文献   

20.
基于Web的信息检索技术综述   总被引:12,自引:0,他引:12  
随着信息技术的发展,特别是Web的不断普及和应用,Web上的信息飞速增长,形成了巨大的信息资源。因此,如何从巨量的信息中快速有效地提取出所需的信息,成为迫切需要解决的问题。文章分别介绍了几种传统的信息检索模型和基于潜在语义分析的信息检索模型,以及自动问答系统,并在多方面对它们进行比较,最后展望了问答系统的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号