首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
针对信息系统中海量数据多源异构和难以共享的问题, 提出了多源异构数据虚拟集成框架. 数据集成系统中的GAV(Global-as-View)模式映射方法面对信息量分布不均匀的数据源时, 查询效率较低, 在对GAV改进的基础上, 提出了基于HGAV(Hierarchical-Global-as-view)的模式映射算法, 通过引入中间数据源模式, 形成分层的全局视图, 大大缩减了映射空间, 简化了映射集合, 便于查询的重写和优化. 利用宁东智慧环保项目中的五大类数据对本文所提出的算法加以验证, 实验结果表明该算法相较于GAV模式映射算法提高了数据集成效率, 缩短了查询时间.  相似文献   

2.
数据集成系统提供了一个针对多数据源的统一查询接口。GAV和LAV两种集成映射方法均难以适应数据源和全局视图变化频繁的情况。对此,文章提出一种基于轻映射的数据集成方法来解决这一问题。首先定义了最小视图作为映射的基础,利用函数依赖关系把关系模型分解为最小视图集合,从而把关系映射转换为基本属性的映射。基于该方法,构造了查询重构算法,把基于全局模式的查询转换到基于数据源模式的查询,并通过一些实例加以说明。  相似文献   

3.
查询接口集成是Deep Web数据集成的关键,在动态环境下,Web数据源的变化会引起数据模式映射的失效,使得查询接口集成维护难度增加,因此数据模式映射失效检测是Deep Web数据集成研究中的热点问题.针对目前数据模式映射失效检测方法的局限,在模糊聚集算子的研究基础上,提出一种适用于数据模式映射失效检测的结果融合算法.通过实验对比测试,并对映射失效检测方法的性能和效率进行了分析和实验,结果证明了提出的方法对于失效模型的检测是有效的.  相似文献   

4.
程骄杰  张忠能 《计算机工程》2004,30(Z1):640-642
给出了一种分布式异构数据源集成查询系统的设计与开发.能够实现对关系型数据库、文本文件和XML文档等不同数据源的透明存取.查询系统读取不同数据源的数据字典,通过模式管理器建立起集成模式.用户通过查询处理器建立基于集成模式的查询,系统根据连接信息和配置信息把对集成模式的查询分解成对每个数据源的子查询,各个数据源的查询结果返回后要被合并处理,再呈现给用户,实现了对异构数据源的有效查询.  相似文献   

5.
程骄杰  张忠能 《计算机工程》2004,30(12):640-642
给出了一种分布式异构数据源集成查询系统的设计与开发。能够实现对关系型数据库、本件和XML档等不同数据源的透明存取,查询系统读取不同数据源的数据字典,通过模式管理器建立起集成模式。用户通过查询处理器建立基于集成模式的查询,系统根据连接信息和配置信息把对集成模式的查询分解成对每个数据源的子查询,各个数据源的查询结果返回后要被合并处理,再呈现给用户,实现了对异构数据源的有效查询。  相似文献   

6.
韩恺 《计算机工程与应用》2006,42(17):167-170,217
提出一种多XML数据源的语义集成和查询处理的途径,通过一定步骤将各个局部DTD模式集成为全局模式,同时生成全局模式到局部模式的映射。在查询处理中,查询被表示成查询树的形式,引入了补查询和连接子等概念,给出了查询分解和执行的具体算法,并首次提出并分析了XML集成环境下产生不确定查询结果的情况。  相似文献   

7.
王江海  吴扬扬 《计算机科学》2012,39(10):170-173,186
提出了一种数据空间中的命名实体集成模型(NEIM)及其在异质异构数据源中的集成方法。命名实体模型描述了数据源、实体与实体描述间的关系,能够实现从其中任意一个息查询到其它相关信息。命名实体的集成架构指出了数据空间中命名实体集成要完成的主要任务,包括命名实体的识别、实体的集成映射和实体的统一。集成算法描述了数据空间中异构数据源包含的命名实体及其描述信息的集成方法。针对结构化半结构化数据,它采取构建映射规则,使系统可以在后期持续集成这些数据源中的实体信息,实验验证了集成方法的构建映射规则的有效性。  相似文献   

8.
分布式自治数据源的联合查询   总被引:4,自引:0,他引:4  
不同数据源之间数据结构和表示方法的不同以及这些数据源在查询能力上受到的限制,使得对分布式异构数据源的集成和综合查询成为一个困难的问题、基于元数据描述,在语义正确的前提下,根据不同查询条件和不同数据源能力,自动构造查询计划是解决这个问题的一个可行方向,并可以根据实际需要有不同的具体方法,以快速构造查询计划为目的的直观算法,和以充分利用各种数据源尽可能全面构造所有可能的查询计划为目的的闭包算法是其中两种典型的方法,实验表明这两种方法具有不同的特点和适用情况。  相似文献   

9.
异构数据源集成技术在军事中的应用   总被引:1,自引:0,他引:1  
军队信息化建设过程中,存在着大量异构、分散的数据信息,信息间关联性不易确定,形成一个个"信息孤岛".针对该现状,结合当前主流异构数据源集成技术,提出基于军事应用的异构数据源集成方案.使用XMLSchema定义全局数据模式,XOuery作为数据查询语言,采用数据映射技术,实现军事数据信息在军队系统中的共享集成.同时,在系统中采用基于角色的访问控制策略,提高了系统的整体安全性.  相似文献   

10.
由于异构数据源集成系统需要集成包括WWW在内的各种数据源,有些数据源既无规则的模式结构,又无强有力的查询功能,给查询规划造成一定的困难.在分析异构集成系统中查询规划生成需求的基础上,引入数据源能力描述的概念,进而提出数据源能力描述框架.该框架以数据源局部模式与中介模式的语义映射以及数据源查询能力的描述为支撑,较好的满足了查询规划的需求,并为查询优化提供保证.在此基础上,设计了一个基于数据源能力描述的查询规划系统框架,并通过一个完整的例子说明数据源能力描述框架在查询规划中的应用.  相似文献   

11.
根据空间数据源的特点给出一种表示空间数据源能力信息的方法,包括导出模式、查询能力和转换能力.在此基础上查询计算引擎针对用户查询集成多个分布式空间数据源的能力,通过构造模式图和函数图为用户查询构造相应的查询转换步骤,使用户能够仅给出单一查询,系统可以完全自动地访问多个空间数据源从而返回最终查询结果.该系统可作为空间信息集成的一个重要模块,并具有很强的可扩展性.  相似文献   

12.
In the study of data exchange one usually assumes an open-world semantics, making it possible to extend instances of target schemas. An alternative closed-world semantics only moves ‘as much data as needed’ from the source to the target to satisfy constraints of a schema mapping. It avoids some of the problems exhibited by the open-world semantics, but limits the expressivity of schema mappings. Here we propose a mixed approach: one can designate different attributes of target schemas as open or closed, to combine the additional expressivity of the open-world semantics with the better behavior of query answering in closed worlds. We define such schema mappings, and show that they cover a large space of data exchange solutions with two extremes being the known open and closed-world semantics. We investigate the problems of query answering and schema mapping composition, and prove two trichotomy theorems, classifying their complexity based on the number of open attributes. We find conditions under which schema mappings compose, extending known results to a wide range of closed-world mappings. We also provide results for restricted classes of queries and mappings guaranteeing lower complexity.  相似文献   

13.
提出了一种基于Web的本体服务器设计,描述了其内部体系结构和与外部交互的过程,在此基础上深入介绍了其查询接口.该本体服务器能够同时为Web用户和软件agent提供本体的查询、编辑和推理等功能.为解决Web环境中大量的异构数据源之间的互操作问题提供了技术方案.  相似文献   

14.
Answering queries using views: A survey   总被引:25,自引:0,他引:25  
The problem of answering queries using views is to find efficient methods of answering a query using a set of previously defined materialized views over the database, rather than accessing the database relations. The problem has recently received significant attention because of its relevance to a wide variety of data management problems. In query optimization, finding a rewriting of a query using a set of materialized views can yield a more efficient query execution plan. To support the separation of the logical and physical views of data, a storage schema can be described using views over the logical schema. As a result, finding a query execution plan that accesses the storage amounts to solving the problem of answering queries using views. Finally, the problem arises in data integration systems, where data sources can be described as precomputed views over a mediated schema. This article surveys the state of the art on the problem of answering queries using views, and synthesizes the disparate works into a coherent framework. We describe the different applications of the problem, the algorithms proposed to solve it and the relevant theoretical results. Received: 1 August 1999 / Accepted: 23 March 2001 Published online: 6 September 2001  相似文献   

15.
基于实例的Deep Web数据源结果模式匹配技术   总被引:1,自引:0,他引:1       下载免费PDF全文
针对Deep Web数据源结果模式信息的匹配问题,提出了一种基于实例的结果模式匹配的方法。该方法能够匹配并验证数据源的结果模式属性信息,同时记录数据在结果页面中的结构信息。利用基于查询请求松弛的两段模式匹配方法精确地匹配模式属性,并基于模式属性间共现度信息来提高属性匹配的查全率和查准率。从实验结果分析可以看出,基于实例的方法能够有效地识别数据源模式信息,提高模式属性查全率和查准率。  相似文献   

16.
基于模式集成语义的查询处理   总被引:1,自引:0,他引:1  
石祥滨  张斌  于戈  郑怀远 《软件学报》1998,9(5):321-326
在采用面向对象模型作为公共数据模型的多数据库系统中,基于模式集成语义的查询处理不仅要实现针对集成模式查询到针对输出模式查询的转换,而且要从语义上尽可能减少回答用户查询所需数据,保证对象引用的正确性.为了达到这个目标,提出了一些新的概念及基于模式集成语义的查询处理规则和路径表达式的查询处理方法.  相似文献   

17.
This paper presents an approach to query decomposition in a multidatabase environment. The unique aspect of this approach is that it is based on performing transformations over an object algebra that can be used as the basis for a global query language. In the paper, we first present our multidatabase environment and semantic framework, where a global conceptual schema based on the Object Data Management Group standard encompasses the information from heterogeneous data sources that include relational databases as well as object-oriented databases and flat file sources. The meta-data about the global schema is enhanced with information about virtual classes as well as virtual relationships and inheritance hierarchies that exist between multiple sources. The AQUA object algebra is used as the formal foundation for manipulation of the query expression over the multidatabase. AQUA is enhanced with distribution operators for dealing with data distribution issues. During query decomposition we perform an extensive analysis of traversals for path expressions that involve virtual relationships and hierarchies for access to several heterogeneous sources. The distribution operators defined in algebraic terms enhance the global algebra expression with semantic information about the structure, distribution, and localization of the data sources relevant to the solution of the query. By using an object algebra as the basis for query processing, we are able to define algebraic transformations and exploit rewriting techniques during the decomposition phase. Our use of an object algebra also provides a formal and uniform representation for dealing with an object-oriented approach to multidatabase query processing. As part of our query processing discussion, we include an overview of a global object identification approach for relating semantically equivalent objects from diverse data sources, illustrating how knowledge about global object identity is used in the decomposition and assembly processes.  相似文献   

18.
The integration of data, especially from heterogeneous sources, is a hard and widely studied problem. One particularly challenging issue is the integration of sources that are semantically equivalent but schematically heterogeneous. While two such data sources may represent the same information, one may store the information inside tuples (data) while the other may store it in attribute or relation names (schema). The SchemaSQL query language is a recent solution to this problem powerful enough to restructure such sources into each other without the loss of information. We propose the first incremental view maintenance strategy for such schema-restructuring views. Our strategy, based on an algebraic representation of the view query, correctly transforms a data update or a schema change to a source into sequences of schema and data updates to be applied to the view. We also introduce an optimization of incremental maintenance using batching. We present a proof of correctness of the propagation approach. We also describe the implementation of our SchemaSQL Query Processor and View Maintainer. Last, our experimental results demonstrate that, in many cases, incremental SchemaSQL view maintenance is significantly faster than complete view recomputation.  相似文献   

19.
在大型强子对撞机(LHC)上紧凑型缪子螺线管探测器(CMS)实验的复杂数据环境下,有多个关系型数据源记录了关于数据组织和分布的信息。为实现数据查询系统的精确关键词查询功能,通过分析数据库模式图的方法,将关键词查询语言动态翻译成SQL语言,设计并实现一个跨数据库平台的关键词查询系统。针对动态翻译过程中存在的二义性问题,提出基于查询实体的模式图分析算法,以及基于最小权重树查找的动态连接算法。实验结果表明,该动态连接算法能为关键词查询正确生成所需数据库表的连接方式,使关键词查询系统具有较高的查询效率,以满足用户实时、精确查询的需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号