首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
本文分析了评价搜索引擎中索引机制优劣的几个指标,针对XML文档的特点,设计了一个索引模块,给出了一种倒排索引方法。  相似文献   

2.
一种基于XML文档关键字检索的结构索引   总被引:2,自引:0,他引:2  
娄颖  李战怀  郭文琪  陈群  韩萌 《计算机科学》2010,37(12):120-124
XML数据索引对其检索效率有较大的影响。在深入分析现有XMI、结构索引之后,结合XML文档特点,提出了一种基于关键字检索的结构索引--LSS(Level Structure Summary) . LSS采用了把具有相同标签路径的结点进行合并的策略,具有高效判断结点之间同构异构关系的能力。实现了LSS索引生成算法CSCAN,并在LSS索引的基础上设计了XML关键字检索算法LSSearch。该算法依据LSS索引,将各个关键字的原始倒排表集合分拆成不同类型的子集合,最后在所有子集合上进行查询。实验结果表明,LSS可以帮助减少XML文档中关键字倒排表的规模,提高检索效率。  相似文献   

3.
现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的相关信息,根据扩展倒排索引即可初始化动态哈希表和序号编码链表,并且Pr E算法在执行过程中利用整数的比较代替了字符串的比较。理论分析与实验结果表明,Pr E算法是一种高效的不确定XML关键字查询算法。  相似文献   

4.
建立特殊索引实现XML文档的查询优化   总被引:4,自引:0,他引:4  
结合半结构化数据索引和Lore系统中的索引结构提出了关系数据库中无需特殊数据结构的XML数据的索引的建立及利用索引实现对XML查询的优化。  相似文献   

5.
本文分析了评价搜索引擎中索引机制优劣的几个指标,针对XML文档的特点,设计了一个索引模块,给出了一种倒排索引方法。  相似文献   

6.
为了解决基于LCA(Lower Common Ancestor)的XML关键字查询丢失语义的问题,提出了一种基于“自然语言生成技术(Natural Language Generation,NLG)”的XML关键字查询技术,将NLG的内容规划应用到XML文档,产生针对用户查询的消息语句集,通过对消息语句集的筛选既可以实现基于语义的XML关键字查询,又可以极大地提高查询效率。  相似文献   

7.
一种支持高效XML 路径查询的自适应结构索引   总被引:1,自引:0,他引:1  
张博  耿志华  周傲英 《软件学报》2009,20(7):1812-1824
提出了一种新的自适应结构索引:AS-Index(adaptive structural index),能够克服现有静态索引和自适应索引的缺陷,具备高效的查询和调整性能.AS-Index 建立在F&B-Index 的基础之上,其索引结构包括F&B-Index,Query-Table 和Part-Table.Query-Table 能够记录频繁查询,避免了查询过程中的冗余操作.并且,在Query-Table 的基础上提出了自底向上的查询处理过程,能够充分利用现有的频繁查询高效地回答非频繁查询.Part-Table 用于优化包含祖先后裔边的查询,进一步提高了查询性能.现有的自适应结构索引的调整粒度是XML 元素节点,调整过程往往需要遍历整个文档.而AS-Index 是基于F&B-Index 节点的增量调整,其过程是局部的,高效的,并且能够支持复杂分支查询的调整.实验结果表明,AS-Index 在查询和调整性能上优于现有的XML 结构索引.同时,相比于现有的自适应结构索引,AS-Index 针对大规模文档具有更加优良的可扩展性.  相似文献   

8.
使用RDBMS的XML文档的扩展倒排索引技术   总被引:1,自引:0,他引:1  
胡光 《计算机工程》2005,31(3):99-101
倒排索引是目前检索领域广泛应用的一种技术,但要对XML文档实现包含查询,该技术还需要改进。该文提出了一种扩展倒排索引技术以处理包含查询,通过实验与以前的方法比较证明了它的有效性。该方法可以不对RDBMS做任何改动,应用在RDBMS中实现处理包含查询能够得到与IR实现一致的效果。  相似文献   

9.
对XML文档查询的常用方法有两种:一种是使用查询语言;另一种是使用关键字,而使用关键字查询XML文档比使用查询语言更为简单方便。给出了一种使用关键字查询XML文档的索引查找算法。该算法只需要扫描一次关键字对应的编码列,就可以找到需要的编码,提高了查询效率。实验表明该算法是可行的和有效的。  相似文献   

10.
XML文档的相似测度和结构索引研究   总被引:20,自引:0,他引:20  
郑仕辉  周傲英  张龙 《计算机学报》2003,26(9):1116-1122
提出了一个可用于定量度量XML文档间差异的方法(称为XED距离)。利用结点间的模拟关系,一个XML文档可以表示为一棵精简的、带权重的结构索引树,两个XML文档间的相似度可以通过计算它们的索引树间的编辑距离来测定,利用索引树可以大大提高判定两个XML文档结构相似度的效率,XED距离测度可用于XML文档的结构搜索、XML文档聚类、XML文档结构抽取、XML文档的变换检测以及XML视图的增量计算和维护等。  相似文献   

11.
XML流上的关键字查询算法   总被引:2,自引:1,他引:1       下载免费PDF全文
针对当前XML流过滤研究中存在的问题,使用关键字查询方法作为解决方案。提出最右包含边界的概念,结合一个虚拟栈实现用于在XML数据流上进行关键字查询的XVirtual Stack算法。理论分析和实验结果证明,该算法具有高效性。  相似文献   

12.
Efficient evaluation of XML queries requires the determination of whether a relationship exists between two dements, A number of labeling schemes have been designed to meet the need. However, most of them have poor updating performance. In this paper, a new dynamic region-based labeling scheme is proposed which uses real numbers instead of integers to represent the region. Moreover, the scheme can adjust the codes of some nodes in some parts of the document tree according to the condition of updates. Our analysis shows this new labeling scheme provides efficient support for updates.  相似文献   

13.
针对XML文档集的关键词检索结果排序   总被引:1,自引:0,他引:1       下载免费PDF全文
探讨了针对XML文档集中只与内容相关的关键词检索结果的排序问题,针对XML文档特征提出了一种新的排序模型,它不同于面向Web的XML网页的搜索结果的排序。设计了满足这种排序模型的倒排列表索引结构和搜索引擎的体系结构。  相似文献   

14.
伍琦  万常选 《计算机科学》2013,40(9):147-151,173
随着云计算下数据外包的流行,可搜索加密的重要性日益凸显.针对Yang等提出的多用户关键词合取搜索方案中,用户必须给全所有关键词值这一局限,设计了一个改进方案.随后,详细分析了新方案的正确性、安全性及运行效率.分析表明,新方案在维持原方案安全性的基础上,实现了用户仅需提交部分关键词这一实用功能.新方案运行效率出色,在云计算“瘦客户机”应用背景下有一定的实践价值.最后附带给出了新方案的一个简易实现.  相似文献   

15.
李求实  王秋月  王珊 《软件学报》2012,23(8):2002-2017
与纯文本文档集相比,使用语义标签标注的半结构化的XML文档集,有助于信息检索系统更好地理解待检索文档.同样,结构化查询,比如SQL,XQuery和Xpath,相对于纯关键词查询更加清晰地表达了用户的查询意图.这二者都能够帮助信息检索系统获得更好的检索精度.但关键词查询因其简单和易用性,仍被广泛使用.提出了XNodeRelation算法,以自动推断关键词查询的结构化信息(条件/目标节点类型).与已有的推断算法相比,综合了XML文档集的模式和统计信息以及查询关键词出现的上下文及其关联关系等推断用户的查询意图.大量的实验验证了该算法的有效性.  相似文献   

16.
XML关键字检索的最低公共祖先快速查找方法   总被引:1,自引:0,他引:1  
XML上的关键字检索由于不需要对XML的模式有所了解,对用户来说是简单而实用的.由于XML的树结构特点,XML上关键字检索需要返回最相关的结果给用户,通常是包含关键字的最小子树.这个问题可以转换为经典的最低公共祖先问题.以前的工作,像XRank和XKsearch都使用dewey编码来解决公共祖先的问题.虽然通过dewey编码来判定祖先后代关系并定位共同祖先结点比较容易,但同时这种方法有如下弊端:首先,频繁的逐段比较dewey编码比较耗时;其次,存储dewey编码比较浪费空间.所以提出了一种有效的基于范围最小值查询的方法来解决XML关键字检索中的最低公共祖先问题.进一步地,将此方法应用到一个计算最小最低公共祖先的非阻塞算法中,并据此实现了一个XML关键字检索系统.实验表明此方法在时间上和空间上都是高效的.  相似文献   

17.
一种基于XLCA的XML关键字搜索方法   总被引:1,自引:0,他引:1  
关键字搜索是大多数普通用户搜索信息的有效手段,因为他们不需要学习复杂的查询语言,也不需要了解底层数据的结构.本文研究了针对XML文档的关键字搜索问题,首先指出前人基于SLCA的结果集定义的不完备性,进而提出基于XLCA的结果集定义,使得其能够包含所有可能的结果.基于这样的结果集定义,给出了一种精简的索引结构以及相应的搜索算法,并实现了这两种不同的方法,实验证明本文提出的方法在性能以及可扩展性方面均有较大的提高.  相似文献   

18.
林子雨  邹权  赖永炫  林琛 《软件学报》2014,25(3):528-546
关键词查询可以帮助用户从数据库中快速获取感兴趣的内容,它不需要用户掌握专业的数据库结构化查询语言,降低了使用门槛.针对基于关键词的数据库查询,基于数据图的方法是一种比较常见的方法,它把数据库转换成数据图,然后从数据图中计算最小Steiner树.但是,已有的方法无法根据不断变化的用户查询兴趣而动态优化查询结果.提出采用蚁群优化算法解决数据库中的关键词查询问题,并提出了基于概念漂移理论的用户查询兴趣突变探查方法,可以及时发现用户兴趣的突变.在此基础上,提出了基于概念漂移理论和蚁群优化算法的查询结果动态优化算法ACOKS*,可以根据突变的用户兴趣,动态地优化查询结果,使其更加符合用户查询预期.在原型系统上得到的大量实验结果表明,该方法具有很好的可扩展性,并且可以比已有的方法取得更好的性能.  相似文献   

19.
XML数据流上的关键字查询   总被引:3,自引:1,他引:3  
XML数据流上的XPath & XQuery查询处理是目前研究者关注的热点问题,但由于XPath & XQuery查询语言相对复杂,在不知道模式信息的前提下,用户很难通过已有的查询接口得到自己感兴趣的数据片断,因此如何在数据流模型上根据XML数据的特点为用户提供最友好的查询接口就成为一个亟待解决的问题.针对这个问题,创新地提出了在XML数据流上做关键字查询的问题,给出了最小相关连通子树(SRCT)的概念用于处理返回的结果,并设计了一种新的基于栈的Lookup算法,可以有效解决在XML数据流上进行关键字查询的问题,最后通过实验从不同角度对Lookup算法的各项性能指标进行了验证.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号