共查询到19条相似文献,搜索用时 125 毫秒
1.
2.
查询重写是数据集成的一个关键问题,它是将用户的查询请求自动重写为直接面向数据源的查询请求。最近Michigan大学和IBM的AImaden研究中心提出了一种新的基于约束的XML查询重写算法,但是该算法没有考虑复杂模式匹配重写问题,使得该算法应用受到限制。在原来的算法重写思想基础上,提出了一种改进的XML查询重写算法,扩大原算法的应用范围,并分析了改进算法的正确性和时间复杂度。 相似文献
3.
数据集成中XML数据查询语义重写 总被引:10,自引:0,他引:10
查询重写是数据库研究的一个基本问题,它和查询优化,数据仓库,数据集成,语义缓存等数据库问题密切相关,为提高集成系统的查询效率,系统选择提交频率较高的XML查询物化为中间层视图,用户提交查询后,系统尽可能利用中间视图层中视图,而不是访问数据源来回答查询,这个问题实际可以归结为半结构化查询重写问题,考虑到中间视图层空间的有限性,已有视图应当尽可能回答更多的查询,传统查询重写方法有考虑半结构化数据之间的约束,而根据约束可以等价变换查询,从而提高中间视图层中的表达能力,提出了一种新的半结构化查询重写的方法,该方法在保证算法正确性和完备性的基础上,利用上半结构化数据中的约束,尤其是XML文件中的路径依赖,来增强中间层物化视图的表达能力,理论分析和初步原型实验证明方法的有效性。 相似文献
4.
异构数据源集成应用模型及其查询处理方法 总被引:6,自引:1,他引:6
异构数据源联合使用的目的是屏蔽数据源的异构性,提供给用户一个使用多种数据源的统一接口,在实现联合使用的系统中的难点是用户查询的重写和分解。该文介绍了基于半结构化数据模型的异构数据源联合使用的实现,描述了其中的查询重写和查询分解的方法。 相似文献
5.
针对信息系统中海量数据多源异构和难以共享的问题, 提出了多源异构数据虚拟集成框架. 数据集成系统中的GAV(Global-as-View)模式映射方法面对信息量分布不均匀的数据源时, 查询效率较低, 在对GAV改进的基础上, 提出了基于HGAV(Hierarchical-Global-as-view)的模式映射算法, 通过引入中间数据源模式, 形成分层的全局视图, 大大缩减了映射空间, 简化了映射集合, 便于查询的重写和优化. 利用宁东智慧环保项目中的五大类数据对本文所提出的算法加以验证, 实验结果表明该算法相较于GAV模式映射算法提高了数据集成效率, 缩短了查询时间. 相似文献
6.
查询重写是解决数据集成、查询优化和物理层数据独立性等问题的关键技术.以往工作主要集中在关系数据模型方面.最近Michigan大学Timber研究小组提出一种全新的基于约束的XML查询重写算法.然而,该算法未考虑存在内定谓词情况下的重写问题,应用范围受到一定限制.在原算法的重写思想基础上,提出了一种基于约束的XML查询重写的改进算法.通过引入映射规则中的约束条件,消除阻碍重写的Skolem函数,从而解决内定谓词问题,增大原算法的应用范围.证明了改进算法的正确性.性能分析和测试结果表明,改进算法并不增加实质性的性能代价. 相似文献
7.
半结构化数据查询重写 总被引:10,自引:1,他引:10
查询重写是数据库研究的一个基本问题,它和查询优化,数据仓库,信息集成,语义缓存等问题紧密相关,目前Internet上存在海量的半结构化数据,在信息集成过程中产生了大量半结构化视图,如何利用物化半结构化视图来重写用户查询,减少响应时间成为研究热点问题,上述问题本质上是NP问题,提出了一种半结构化查询重写的新方法,该方法在保证算法正确性和完备性的基础上,利用半结构化数据特点和查询子目标之间的关系,减少了指数空间的查询重写候选方案生成,理论分析表明,它极大地降低了算法的代价。 相似文献
8.
随着XML文档大量涌现,如何有效地管理和查询XML数据已经成为亟待解决的问题。在数据库中,基于视图的查询重写技术是查询优化的一个重要技术,利用缓存的视图结果回答新查询不需要访问源数据库进行查询,能够节省查询处理时间。本文在研究基于物化视图的查询重写的过程中,给定一个查询和一个视图,首先判断该查询在视图下是否存在查询重写,而重写的存在问题与模式包含问题密切相关,为此,提出使用多分支的模式匹配算法实现对多分支路径的模式匹配,解决重写是否存在的问题。 相似文献
9.
为了有效地对异构专利数据源进行统一的查询,提出一个基于本体的异构专利数据源集成系统.该系统引入本体解决数据源集成中存在的语义异构,通过全局数据模式为用户提供统一的查询接口,将用户针对全局数据模式的查询重写为针对各个局部数据源的子查询.使用该系统,用户可以从异构的专利源中得到正确的查询结果. 相似文献
10.
Web信息集成系统中查询的处理 总被引:1,自引:0,他引:1
为了有效地实现对Web上异构数据源的统一查询处理,提出了一个基于本体的异构数据源集成系统模型OBIISM,引入本体解决各数据源语义层上的异构,通过两级查询重写将用户提交的查询转化为对数据源的查询,为查询异构数据源提供了一个语义统一的接口. 相似文献
11.
MiniCon: A scalable algorithm for answering queries using views 总被引:5,自引:0,他引:5
Rachel Pottinger Alon Halevy 《The VLDB Journal The International Journal on Very Large Data Bases》2001,10(2-3):182-198
The problem of answering queries using views is to find efficient methods of answering a query using a set of previously
materialized views over the database, rather than accessing the database relations. The problem has received significant attention
because of its relevance to a wide variety of data management problems, such as data integration, query optimization, and
the maintenance of physical data independence. To date, the performance of proposed algorithms has received very little attention,
and in particular, their scale up in the presence of a large number of views is unknown. We first analyze two previous algorithms,
the bucket algorithm and the inverse-rules, and show their deficiencies. We then describe the MiniCon, a novel algorithm for
finding the maximally-contained rewriting of a conjunctive query using a set of conjunctive views. We present the first experimental
study of algorithms for answering queries using views. The study shows that the MiniCon scales up well and significantly outperforms
the previous algorithms. We describe an extension of the MiniCon to handle comparison predicates, and show its performance
experimentally. Finally, we describe how the MiniCon can be extended to the context of query optimization.
Received: 15 October 2000 / Accepted: 15 April 2001 Published online: 28 June 2001 相似文献
12.
13.
异构数据源集成系统查询分解和优化的实现 总被引:54,自引:0,他引:54
通用异构数据源集成系统需要集成包括WWW在内的各种数据源,有些数据源既无规则的模式结构,又无强有力的查询功能,给全局查询的分解和优化造成一定的困难.异构数据源集成系统Versatile一方面利用局部动态字典的模板操作构造集成系统全局动态字典,作为查询分解和优化的依据.一方面采用基于缓存和数据源能力的查询分解和优化策略,以便充分利用数据源的查询能力,简化包装器的设计,并取得较高的查询效率. 相似文献
14.
Towards Intelligent Semantic Caching for Web Sources 总被引:2,自引:0,他引:2
An intelligent semantic caching scheme suitable for web sources is presented. Since web sources typically have weaker querying capabilities than conventional databases, existing semantic caching schemes cannot be directly applied. Our proposal takes care of the difference between the query capabilities of an end user system and web sources. In addition, an analysis on the match types between a user's input query and cached queries is presented. Based on this analysis, we present an algorithm that finds the best matched query under different circumstances. Furthermore, a method to use semantic knowledge, acquired from the data, to avoid unnecessary access to web sources by transforming the cache miss to the cache hit is presented. To verify the effectiveness of the proposed semantic caching scheme, we first show how to generate synthetic queries exhibiting different levels of semantic localities. Then, using the test sets, we show that the proposed query matching technique is an efficient and effective way for semantic caching in web databases. 相似文献
15.
16.
异构数据源集成系统旨在为用户提供一个一致的访问接口,由于参与集成的各数据源不仅高度自治、模式各异、更新频繁,而且查询功能有各自特殊的限制,给查询处理过程中数据源定位和查询优化造成一定的困难。本文在分析异构集成系统特征和功能需求的基础上,提出一种基于KQML的数据源能力描述框架,为各数据源灵活动态的发布自身能力提供保证。进而通过形式化的规范描述刻画数据源的结构特征和行为特征,为定位查询相关数据源奠定基础.并有助于全局查询处理器对查询计划进行优化,缩减查询的搜索空间,提高查询效率。 相似文献
17.
18.
分布式自治数据源的联合查询 总被引:4,自引:0,他引:4
不同数据源之间数据结构和表示方法的不同以及这些数据源在查询能力上受到的限制,使得对分布式异构数据源的集成和综合查询成为一个困难的问题、基于元数据描述,在语义正确的前提下,根据不同查询条件和不同数据源能力,自动构造查询计划是解决这个问题的一个可行方向,并可以根据实际需要有不同的具体方法,以快速构造查询计划为目的的直观算法,和以充分利用各种数据源尽可能全面构造所有可能的查询计划为目的的闭包算法是其中两种典型的方法,实验表明这两种方法具有不同的特点和适用情况。 相似文献