首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
XML作为一种数据表示方式,越来越为人们所接受.最近,基于XML/半结构化数据的索引的查询引起了人们的广泛关注.有人提出来用结构索引来支持基于XML/半结构化数据的查询.由于XML/半结构化数据的结构不严格、不规则,结构索引会随着数据的增加或删除而变化,维护结构索引就成了首要问题.在本文中,我们研究了在XML文档集合上增加多个文档和删除一个文档时结构索引的更新,提出了在这两种情况下的索引维护算法,这两种算法比现在已知的其他算法的性能要更优秀.  相似文献   

2.
由于半结构化数据缺乏模式信息,因而半结构化数据的存储与查询将是一个十分重要且具有挑战性的研究课题。利用关系数据库存储半结构化数据可以重用数据库的查询优化器和事务处理机制,能够保证半结构化数据的一致性和完整性。该文提出一种实现半结构化数据存储与查询的新方法,该方法使用关系数据库系统来实现半结构化数据的存储与查询。给出了把基于半结构化数据的查询重写为基于关系的查询的算法,同时介绍一个可视化查询程序。  相似文献   

3.
建立特殊索引实现XML文档的查询优化   总被引:4,自引:0,他引:4  
结合半结构化数据索引和Lore系统中的索引结构提出了关系数据库中无需特殊数据结构的XML数据的索引的建立及利用索引实现对XML查询的优化。  相似文献   

4.
近年来,MapReduce并行计算模型受到工业界和学术界广泛关注.基于该模型的系统实现已在谷歌、雅虎、Facebook等大公司内部成功应用.然而,基于MapReduce的系统实现最初用于解决海量无结构、半结构化数据的批处理问题,例如生成倒排索引、计算网页的pagerank、日志分析等,在设计上缺乏针对海量结构化数据进行交互式分析处理的优化考虑,例如:它总是采用全数据集强力扫描的数据处理模式,这有悖于结构化数据管理中常用的操作模式———选择性查询分析处理.针对该问题,引入传统数据库管理领域中常用的全局索引技术,将其应用在基于MapReduce模型的开源项目Hadoop上,以block为粒度对Hadoop分布式文件系统上的结构化数据构建全局索引结构,并给出一种面向范围查询分析的作业编译与调度执行优化算法,主要目标是基于应用语义及辅助索引结构减少不必要的map任务数,进而优化作业的调度开销和执行开销.在实验验证阶段,给出了80%,50%,30%,10%四种数据选择率在3种集群规模下的优化效果,发现作业响应时间最高可提升5倍,I?O开销最高提升10倍,任务调度开销最高提升11倍.  相似文献   

5.
图片、音频、视频、网页等非结构化数据的高速增长使得如何高效管理它们成为一大挑战.提出的多媒体数据索引CFTree*是非结构化数据管理系统平台myBUD中对多媒体数据进行管理的具体研究和实现.CFTree*是基于簇特征树的层次树索引结构,可用于基于内容的近似kNN查询.实验表明,基于CFTree*索引结构的近似kNN查询性能比基于顺序扫描的kNN查询有60%左右的提高.与精确kNN相比,基于CFTree*索引的近似kNN查询结果与查询对象的平均相似度略低于精确kNN结果,但结果的多样性则优于精确kNN结果.  相似文献   

6.
一种新的基于XML的索引机制   总被引:3,自引:1,他引:3       下载免费PDF全文
当前基于Web的半结构化数据越来越受到重视。该文分析了当前对XML数据检索的相关工作,提出了一种路径索引技术,并将之无缝结合了基于文本的倒排索引文档,以实现XML文档的内容和结构的双重检索。该方法只需要对文档库扫描一次,可以大幅度降低用户查询时间。  相似文献   

7.
XML已成为网络上数据表示和交换的一种实际标准。为促进XML的数据和半结构化数据的查询,几种结构概要被提出。它们可以直接从数据中得出,并以索引的方式来估计在XML数据上的路径表达式。在本文中,综合几种索引提出新型数据结构D(k,l)索引。其参数k,l刻画了节点向上和向下的相似度。它考虑各个节点向上路径和向下路径的相似关系,因此它可以有效地支持路径表达式,尤其支持带分支路径表达式的查询,同时,它也可以根据查询情况的变化来动态地改变索引结构,使索引结构更适合当前的查询要求,实验表明我们的方法具有很好的效率和效果。  相似文献   

8.
基于XML的关系型数据源包装器的设计   总被引:1,自引:0,他引:1  
用XML表示的半结构化数据越来越普遍,同时,大量的结构化数据被存放在关系数据库中。如何集成这些不同结构的数据,成了研究的一个热点。本文介绍了一种在数据集成系统中XQuery到SQL的映射及查询结果转换成XML的方法,基于该方法设计了一种关系型数据源包装器,它是异构数据集成系统的一个重要组成部分。  相似文献   

9.
数据集成中XML数据查询语义重写   总被引:10,自引:0,他引:10  
查询重写是数据库研究的一个基本问题,它和查询优化,数据仓库,数据集成,语义缓存等数据库问题密切相关,为提高集成系统的查询效率,系统选择提交频率较高的XML查询物化为中间层视图,用户提交查询后,系统尽可能利用中间视图层中视图,而不是访问数据源来回答查询,这个问题实际可以归结为半结构化查询重写问题,考虑到中间视图层空间的有限性,已有视图应当尽可能回答更多的查询,传统查询重写方法有考虑半结构化数据之间的约束,而根据约束可以等价变换查询,从而提高中间视图层中的表达能力,提出了一种新的半结构化查询重写的方法,该方法在保证算法正确性和完备性的基础上,利用上半结构化数据中的约束,尤其是XML文件中的路径依赖,来增强中间层物化视图的表达能力,理论分析和初步原型实验证明方法的有效性。  相似文献   

10.
支持正则路径表达式的查询技术,被认为是半结构化数据模式下的XML查询研究领域中一种颇具有研究价值的XML查询计算方法.基于视图的查询重写技术充分利用视图中的信息来对查询进行优化,提高查询效率.本文讨论了对于支持正则路径表达式的XML查询如何进行重写的问题以及对不同技术的分析.  相似文献   

11.
半结构化数据模型及查询语言   总被引:12,自引:0,他引:12  
在传统数据库中要求查询处理时数据的结构模式已知且固定。这在WWW和异构信息源集成等半结构化数据情形下很难满足。  相似文献   

12.
异构数据源的集成与访问   总被引:2,自引:1,他引:2  
1 引言近年来,Internet/Web技术和计算机硬件的迅速发展对数据库研究领域产生了巨大的影响,提出了新的挑战性问题:一是如何使数据库系统和技术成为Web的有机组成部分,而不仅仅充当Web体系的外围角色;二是如何实现Web动态信息的管理,完成日益增多的新一代Web应用等。人们已认识到Web正在逐渐成为全球性的自主分布式计算环境,Web上的多数站点都具有丰富的数据资源。如果能够把遍及全球的Web数据源集成起来,Web将成为一个全球统一的数据库,由全世界共享。然而Web数据源的集成并非易事,数据源的异构问题是影响Web数据源集成的最大障碍。Web数据源的异构问题主要包括三个方面:第一是模式异构,表现在不  相似文献   

13.
XML is data that has no fixed structure. So it is hard to design a schema for storing and querying an XML data. Instead of a fixed schema, graph-based data models are widely adopted for querying XML. Queries on XML are based on paths in a data graph.A meaningful query usually has several paths in it, but much of recent research is more concerned with optimizing a single path in a query. In this paper, we present an efficient technique for processing multiple path expressions in a query. We implemented our technique and present preliminary performance results.  相似文献   

14.
The widespread use of graph-based models for representing data collections (e.g. object-oriented data, XML data, etc.) has stimulated the database research community to investigate the problem of defining declarative languages for querying graph-like databases. In this paper, a new framework for querying graph-like data based on graph grammars is proposed. The new paradigm allows us to verify structural properties of graphs and to extract sub-graphs. More specifically, a new form of query (namely graph query) is proposed, consisting in a particular graph grammar which defines a class of graphs to be matched on the graph representing the database. Thus, differently from path queries, the answer of a graph query is not just a set of nodes, but a subgraph, extracted from the input graph, which satisfies the structural properties defined by the graph grammar. Expressiveness and complexity of different forms of graph queries are discussed, and some practical applications are shown.  相似文献   

15.
对于综合运输中的铁路、公路、水路和航空运输系统中的异构数据源可以使用网格来实现数据的集成。为了提高网格集成环境中用户查询(涉及多异构数据源)的效率和精确性,提出了基于多本体的并行查询处理方法,给出了全局查询的生成算法和基于查询树的全局查询分解算法。  相似文献   

16.
随着社交网络、生物信息以及web挖掘等应用的不断发展,图结构数据的存储和查询处理越来越得到重视。但是,针对顶点邻域非常密集的场合,如何提高此类顶点的查询效率,现有的研究相对较少。论文在分析了顶点密集领域数据的特点后,提出了一种对顶点密集邻域建立路径索引的策略,有效地解决了此类查询的效率。首先分析顶点密集的邻域的查询模式,并在这些模式上建立路径索引,然后采用B 树方法,对路径索引的存储、更新和查找方法进行了设计实现,最后,采用图数据库NEO4J为基础,对路径索引存储空间和查询性能进行了测试,测试表明,虽然路径索引会占用存储空间,但是能够提高特定的查询处理的性能。  相似文献   

17.
Querying multimedia presentations based on content   总被引:2,自引:0,他引:2  
Considers the problem of querying multimedia presentations based on content information. Multimedia presentations are modeled as presentation graphs, which are directed acyclic graphs that visually specify the presentations. We present a graph data model for the specification of multimedia presentations and discuss query languages as effective tools to query and manipulate multimedia presentation graphs with respect to content information. To query the information flow throughout a multimedia presentation, as well as in each individual multimedia stream, we use revised versions of temporal operators Next, Connected and Until, together with path formulas. These constructs allow us to specify and query paths along a presentation graph. We present an icon-based graphical query language, GVISUAL, that provides iconic representations for these constructs and a user-friendly graphical interface for query specification. We also present an OQL-like language, GOQL (Graph OQL), with similar constructs, that allows textual and more traditional specifications of graph queries. Finally, we introduce GCalculus (Graph Calculus), a calculus-based language that establishes the formal grounds for the use of temporal operators in path formulas and for querying presentation graphs with respect to content information. We also discuss GCalculus/S (GCalculus with Sets) which avoids highly complex query expressions by eliminating the universal path quantifier, the negation operator and the universal quantifier. GCalculus/S represents the formal basis for GVISUAL, i.e. GVISUAL uses the constructs of GCalculus/S directly  相似文献   

18.
在Web迅猛发展和半结构化数据急剧膨胀的今天,Web上的半结构化数据查询日益成为信息技术领域一个重要的研究发展方向。现有的半结构化查询语言在查询效率上存在着不足。文章提出了一个将模型检测技术应用到半结构化数据查询的新方法,它通过把数据库看作Kripke状态变迁系统,把查询解释为时序逻辑CTL公式,将查询过程转化为模型对公式的满足问题,通过模型检测过程高效地完成数据查询,从而使查询可以在多项式时间内完成,很好地改善了查询效率。最后,给出了该方法在现有半结构化查询语言Lorel上的应用。  相似文献   

19.
基于XML的文件系统与多数据库系统的集成   总被引:6,自引:0,他引:6  
文件系统与多数据库系统集成是解决多个分布的异构数据源数据共享的必由之路。本文在对文件系统与多数据库系统集成中的问题进行分析的基础上,提出利用可扩展置标语言XML来实现文件系统与多数据库系统集成,并且提出了一种面向XML Schema的公共数据模型XIDM。XIDM能较好描述无结构化和半结构化数据的数据,建立在一系列XML标准的基础上,具有较强的实用性和通用性。文章还对目前XML的查询语言进行了讨论,确定将扩展的XML-QL作为配合XIDM的查询语言。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号