首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
XML非完全结构查询(NFS)允许用户利用部分XML结构信息,甚至仅仅是关键字来描述查询要求,是在缺乏完整的XML文档结构信息情况下的重要查询手段.针对图模型下的NFS有意义结果判断问题,在PE模型基础上提出一种基于图的有意义结果判断模型GPE,包括结果粒度、模式实体定义、等价模式定义和判断规则;针对标签歧义性和复杂的结构语义,GPE提出一种结合基于领域字典的语境受限的标签语义相似性和模式结构相似性的等价模式计算方法.通过在实际数据集和XML实验数据上的实验表明,GPE模型在查准率和查全率上均有较大提高.  相似文献   

2.
介绍了一种基于Web的分布式EMC数据库集成查询系统的设计及其实现。系统通过中间代理层向用户提供了统一的数据库视图,并采用了一种基于关键字的倒排索引方法以提高系统的查询性能。  相似文献   

3.
在关键字查询领域,目前提出的大多数索引结构主要考虑的是静态的XML文档.当XML文档出现频繁更新时,这些索引结构可能面临着大范围的重新编码,从而增加了数据库索引维护的代价.为了能在XML文档动态更新的环境下保持其索引结构的稳定,提出了一种支持动态XML文档上关键字查询的索引结构DLSS( DDE Level Structure Summary).该索引结构采用了一种针对动态更新改进的Dewey编码,该编码只需在文档更新时对新的节点赋予相应的编码,而不需要调整原有的编码结构.实验证明,DLSS索引结构可以在XML文档频繁更新或者较少更新时都能保持索引结构的相对稳定,并能在其上实现较高的关键字查询效率.  相似文献   

4.
倒排索引创建效率和查询效率是全文检索技术的两个重要方面.针对传统倒排索引创建方法效率低下的问题,提出了基于缓存满再写临时文件和双缓冲区相结合的索引创建机制,充分利用内存和CPU资源以加快倒排索引的创建速度;提出了查询缓存机制,以提高倒排索引的查询效率.分析及实验结果表明,提出的索引创建机制能有效地提高索引创建速度,查询缓存机制能有效地加快查询速度,提高了全文检索系统的时间和空间效率.  相似文献   

5.
介绍索引系统的基本结构以及经典查询处理方式DAAT和TAAT ,给出在AND和OR两种布尔查询下的查询处理算法实现细节。分析结果表明,在海量索引规模查询的情况下,DAAT索引遍历方式要优于TAAT索引遍历方式,OR查询和AND查询的性能差距进一步加大,基于TREC WT2G和GOV2的多组实验验证了分析的结论。指出下一步在海量索引规模下搜索引擎查询处理研究的方向。  相似文献   

6.
处理路径表达式是XML查询技术中的难点和热点.在本实验室提出的XML路径表达式索引-结构化映射的基础上.为了降低构建索引所需的空间开销,本文提出了构建路径索引的代价模型,并设计了基于给定查询负载,有选择地构建路径索引的相应算法,为给定查询负载自动选择近最优索引模式(NOIS).本文还提出了当查询效率发生变化时,系统对索引模式进行自适应调整的策略.实验研究表明:使用本文方法,系统可在不影响路径表达式处理效率的前提下,大大降低路径索引的空间开销,取得查询收益和空间开销的较佳权衡.  相似文献   

7.
在全文信息检索系统中,存储文本及其上关键词的索引结构需要大量的空间。位图索引不能支持基于信息量的查询,倒排文件需要的空间比较大。提出了频率向量这种索引结构的压缩存储方法,设计并实现了基于这种压缩存储方法的存储结构,理论分析表明该压缩方法与存储结构可以获得较高的压缩比;此外,还讨论了压缩频率向量上的查询处理技术,实验结果表明这种压缩的索引结构能够保证查询结果的完备性,并能有效地提高频率向量的存储和查询效率。  相似文献   

8.
针对XML数据的半结构化特征,设计了一种新型索引模块,给出一种新的倒排索引方法.构建了利用高频路径产生的索引机制,通过映射实现表和XML数据文档之间的转换,实现XML 数据库事务处理和版本控制,最后通达基于XML的路径查找算法的实验,快速检索出文件中重要的连续路径.  相似文献   

9.
基于路网距离的多源Skyline查询在地图服务中广泛使用,但现有的Skyline查询方法对于复杂的路网距离计算效率低下,并且随着查询点数量的增加查询结果集变得过于庞大,无法为用户提供精简有效的查询结果。为了提高查询结果的有效性和查询效率,提出一种基于最小聚合距离的倒排索引Skyline查询算法,该算法对道路网建立QG-tree索引,提高聚合距离的计算效率;同时对兴趣点集建立倒排索引,结合剪枝策略对兴趣点进行检索,减少聚合距离计算和支配判定的开销,有效地提高查询效率。在真实道路网上的实验表明,所提出的算法效率比现有算法DSR和N3S快1~3个数量级,可以有效地处理道路网环境下多源Skyline查询问题。  相似文献   

10.
李东  吴鹏 《计算机工程与设计》2007,28(23):5755-5757,5769
XML已经成为互联网中数据表示和数据交换事实上的标准.实现专门对于XML数据的有效存储和查询变得十分重要.报告了当前NativeXML数据库在国内外的发展情况,讨论了一种NativeXML数据库管理系统原型XSQS的功能及概要设计.系统采用了基于压缩表的存储方式和索引结构,采用了基于结果集的查询处理方法.重点讨论了系统查询处理部分的设计及实现.实践结果表明,这种存储索引结构和查询方式相结合,使系统在查询效率上有了显著的提高.  相似文献   

11.
分别概述了微波极化指数、散射指数以及土壤湿度指数等被动微波遥感指数的发展及其应用。37GHz的微波极化差指数△T37(△T37=TB37V—TB37H)和极化比指数(MPDI=C*(TB37V—TB37H)/(TB37V+TB37H))被认为是监测植被状况的微波植被指数,利用GAME—Tibet1998IOP数据计算和分析了青藏高原中部5个试验站点6~9月的平均△T37值和MPDI值的变化情况。结果表明:ANDUO和MS3608的平均值在15K左右,表现出裸土的微波辐射特征;总体上5个站点的MPDI随时间的变化不大,也即在1998年6~9月间,各个站点的植被状况变化不大;而站间的差别比较大,也即各个站点的植被状况有较大的差别;ANDUO的MPDI表现出规律性的变化,即在6至9月的变化中,8月份的MPDI最小,对应植被最好的月份;对研究区的MPDI和相应时间的MSAVI(可见/近红外数据得到的修改型土壤调整植被指数)的空间分布图进行了比较,二者基本吻合。  相似文献   

12.
论文结合网格索引和R树索引的特点,提出了一种基于粗分网格和聚类R树的混合索引方案(HSIBGR)。该方案首先将矩形地理空间进行粗网格划分建立一级索引,然后针对每个小网格建立基于R树的二级索引,采用聚类技术处理溢出R树结点的分裂。论文还对HSIBGR索引机制进行了理论分析和实验验证,结果表明HSIBGR索引机制能有效地减少存储开销,提高检索效率,具有良好的性能。  相似文献   

13.
面向对象数据库的索引技术   总被引:5,自引:0,他引:5       下载免费PDF全文
本文研究类层次索引、嵌套索引、路径索引和多重索引,并给出相应的索引维护算法。  相似文献   

14.
本文介绍了现有的对影像数据管理和索引的方法及其存在的不足,提出了一种基于非均匀划分思想对分布式影像数据进行管理和索引的方法,避免了由于边缘补零带来的时间和空间开销。实验结果表明,本文方法能够支持对分布式多图幅的联合查询以及结果的无缝拼接,而且其时间和空间代价远小于现有方法。  相似文献   

15.
利用一种简单直观的一个改进的拓扑指数D,路径指数P2和位置指数S来表征多烷基苯的分子结构,并建立了多烷基苯的沸点与其分子结构之间的定量关系式。拓扑指数的相关性良好,对各种多烷基苯及其异构体的沸点的预测结果与文献值一致性令人满意。  相似文献   

16.
针对分布式存储系统上使用非主键访问数据带来的性能问题,探讨在分布式存储系统上实现索引的相关关键技术。在充分分析分布式存储特征的基础上,提出了分布式索引设计和实现的关键点,并结合分布式存储系统的特点及相关的索引技术,讨论了索引的组织形式、索引的维护和数据一致性等问题;然后基于如上的分析,选择在分布式数据库系统OceanBase开源版本上,设计和实现分布式索引机制,并通过基准测试工具YCSB进行性能测试。实验结果表明,虽然辅助索引会对系统性能产生影响,但因为充分考虑了系统特征及存储特点,在不同数据规模下,该索引都能够将性能影响控制在5%以内。另外,使用冗余列的方式,能进一步将该索引的性能提升100%。  相似文献   

17.
Oracle数据库应用系统的性能优化是一项系统化的工程,涉及到数据库结构的各个方面。本文从B*树索引入手,分析了B*树索引的结构及原理,阐明了如何正确合理地使用B*树索引及其如何优化数据库系统的性能。  相似文献   

18.
Huang and Liu [Generalized scrambling indices of primitive a digraph, Linear Algebra Appl. 433 (2010), pp. 1798–1808] gave the definitions of the generalized μ-scrambling indices and the generalized scrambling indices of a primitive digraph and also provided some exact lower and upper bounds for the generalized scrambling indices of various classes of primitive digraphs. In this paper, we give some exact lower and upper bounds for the generalized μ-scrambling indices of various classes of primitive digraphs.  相似文献   

19.
基于动态文档集的索引技术*   总被引:1,自引:0,他引:1  
倒排文件是全文检索中广泛使用的索引结构,对静态文档集合建立倒排索引的研究已有较长时间。随着计算机技术的发展,需要存储的数据越来越大。同时特定的应用领域如新闻搜索、桌面搜索等对实时更新性能要求较高,这需要使用有效的索引更新策略,也称动态索引。描述了常用的动态索引技术,并详细分析了其使用代价。  相似文献   

20.
Intense regulatory focus on secure retention of electronic records has led to a need to ensure that records are trustworthy, i.e., able to provide irrefutable proof and accurate details of past events. In this paper, we analyze the requirements for a trustworthy index to support keyword-based search queries. We argue that trustworthy index entries must be durable—the index must be updated when new documents arrive, and not periodically deleted and rebuilt. To this end, we propose a scheme for efficiently updating an inverted index, based on judicious merging of the posting lists of terms. Through extensive simulations and experiments with two real world data sets and workloads, we demonstrate that the scheme achieves online update speed while maintaining good query performance. We also present and evaluate jump indexes, a novel trustworthy and efficient index for join operations on posting lists for multi-keyword queries. Jump indexes support insert, lookup and range queries in time logarithmic in the number of indexed documents.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号