首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 138 毫秒
1.
一种基于Ontology的数据集成系统   总被引:1,自引:0,他引:1       下载免费PDF全文
陈遥  李珊  厉浩 《计算机工程》2007,33(23):90-93
针对异构数据源中实现基于语义的数据集成的需求,采用分层思想,在用户层与实际数据层之间增加一个中间层来屏蔽底层数据的异构,用本体作为公共语义描述工具,建立本体到各数据源的映射规则,设计实现了将基于本体的全局查询转化为基于各数据源的局部查询系统,解决了数据源之间的语义异构问题,其中用OWL表示本体和映射,并研究了系统中的关键技术。  相似文献   

2.
分析了异构专利数据源集成中存在的困难,针对不同专利数据源间存在的分布性、自治性、异构性等问题,提出了一个基于混合本体的专利数据源集成解决方案.该方案采用局部本体描述单个专利数据源中的语义,通过本体合并构建全局本体实现多个专利数据源问的语义集成,定义全局本体与局部本体之间的映射关系解决多个异构数据源集成中存在的语义异构问题.使用该方案,用户可从集成的专利数据源中获取正确的查询结果,有效地解决了"信息孤岛"问题.  相似文献   

3.
基于"数据池"的异构数据的集成,通过建立集成所需的映射规则,引入了代理键和数据颗粒的概念.该集成方法,首先根据语义,建立相应的全局逻辑实体,然后根据映射规则,转换要集成的物理实体到全局逻辑实体.这种方案,比较好的解决了集成中的语义冲突问题,为异构数据集成提供了一种比较可行的方法.  相似文献   

4.
开发了一种新的网格数据服务(GDS),在指定信息描述标准的基础上,提出了通过映射的方法解决数据在信息表示上的异构性。根据信息描述标准将数据源中的数据映射到一张虚拟数据表中,数据源中数据与信息标准之间在的映射关系保存在数据服务中的信息映射表中,用户通过数据服务对虚拟表进行查询。由于数据服务具有标准的Web Service接口,从而实现了对数据源的细节隐藏,达到对数据源的透明访问。  相似文献   

5.
利用中间件方式进行异构数据集成是异构数据集成研究的热点.针对目前中间件方式处理关系数据库数据与XML数据集成在查询易用性以及效率的不足,基于各数据源的数据格式以及存储方式,把异构数据源分成关系数据库数据源,XML数据源和非结构化数据源三类,对每一类用XML模式处理,构建虚拟视图,使待集成的异构数据源构建成一个逻辑数据库...  相似文献   

6.
异构数据源集成技术在军事中的应用   总被引:1,自引:0,他引:1  
军队信息化建设过程中,存在着大量异构、分散的数据信息,信息间关联性不易确定,形成一个个"信息孤岛".针对该现状,结合当前主流异构数据源集成技术,提出基于军事应用的异构数据源集成方案.使用XMLSchema定义全局数据模式,XOuery作为数据查询语言,采用数据映射技术,实现军事数据信息在军队系统中的共享集成.同时,在系统中采用基于角色的访问控制策略,提高了系统的整体安全性.  相似文献   

7.
基于本体的异构数据集成方法及其实现   总被引:2,自引:0,他引:2  
分析了传统异构数据集成中存在的困难,给出一个改进的基于本体的异构数据集成方法.该方法采用本体描述信息源领域中的概念,通过构建语义映射关系,解决数据集成中存在的语义异构问题.  相似文献   

8.
基于RDFS的本体集成方法   总被引:2,自引:0,他引:2  
现实中的数据源一般具有半结构化、异构性和分布性等特点,而许多应用需要对不同的相关数据源进行联合操作。本体集成是解决知识共享、异构数据源语义互操作的有力工具。首先分析了本体集成的原因,提出了本体集成时应遵循的4条基本原则;然后提出了一种基于RDFS图闭包的本体集成方法,该方法将RDFS本体抽象为图模型,根据RDFS推理规则和扩展规则生成RDFS本体的图闭包,在此基础上进行本体集成,同时提出了几种计算实体间相似度的方法。最后,将该方法与FCA-merge和COMA++进行实验对比。  相似文献   

9.
基于语义对象模型的无结构化数据集成的研究   总被引:1,自引:2,他引:1  
数据集成是为了屏蔽数据的异构性,以一种统一的接口访问数据源中的数据。由于无结构化数据没有外在的模式定义,因此基于模式的集成不能适用于流媒体、图形、图像等无结构化数据的集成。该文借鉴面向对象建模方法的思想,提出了语义对象模型的概念,并基于该模型描述了一个集成应用系统的体系结构。  相似文献   

10.
传统的信息集成虚拟方法通常采用Wrapper技术实现结构化异构数据的抽取。针对Wrapper与结构化异构数据源间一对一关系的非灵活性,提出了一种基于公共仓库元模型CWM(Common Warehouse Metamodel)的信息集成架构,利用CWM独立于任何具体实现的优势,在其基础上生成的Wrapper程序可以很好地适用于与之相关的所有结构化异构数据源的抽取。CWM元模型所提供的统一文档类型定义(DTD),使结构化异构数据源拥有了统一的XML表达方式,从而使抽取后的信息可以进行更有效的共享和转换。  相似文献   

11.
The unprecedented increase in the availability of information, due to the success of the World Wide Web, has generated an urgent need for new and robust methods that simplify the querying and integration of data. In this research, we investigate a practical framework for data access to heterogeneous data sources. The framework utilizes the extensible markup language (XML) Schema as the canonical data model for the querying and integration of data from heterogeneous data sources. We present algorithms for mapping relational and network schemas into XML schemas using the relational mapping algorithm. We also present library system of databases (libSyD), a prototype of a system for heterogeneous database access.  相似文献   

12.
现有的命名实体识别算法多半采用统计与规则相结合的办法,但是这些方法有的没有考虑全局信息,有的没有解决好统计模型的时间复杂性问题.提出一个简约语法规则和最大熵模型相结合的混合命名实体识别方法,该方法采用简约语法规则与最大熵模型级联,首先使用简约语法规则模型进行识别,降低了使用复杂语法规则的时间复杂度,并把它的输出进行部分匹配,很好的弥补了由于简约语法规则带来的召回率偏低的问题,然后将得到的中间结果作为输入传递给最大熵模型,再由最大熵模型进行识别,得到最终的识别结果.实验结果表明,在MUC-7的命名实体识别评测中,系统的准确率、召回率和F值分别达到了94%,91%和92.48%,与已有的系统相比在性能上有很大的提升.  相似文献   

13.
数据集成环节,越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难。针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式出错等数据质量问题,提出了基于元数据模型控制的ETL集成模型,并对数据集成过程中的各种映射规则进行了详细的定义,通过将抽取、转换、加载环节的元模型和映射机制相结合,能够有效地保证集成后数据的数据质量。提出的元模型已经应用到科技资源管理数据集成业务中。通过科技资源管理数据集成实例分析,验证了此数据集成方案能够有效地支撑大数据环境下数据仓库的构建和集成后数据质量的提升。  相似文献   

14.
Integration and coordination of distributed processes remains a central challenge of construction information technology research. Extant technologies, while capable, are not yet scalable enough to enable rapid customization and instantiation for specific projects. Specifically, the heterogeneity of existing legacy sources together with firms’ range of approaches to process management makes deployment of integrated information technologies impractical. This paper reports on an architecture for distributed process integration named process connectors that addresses heterogeneity in a scalable manner. The process connectors architecture incorporates two key approaches that address heterogeneity over varying time scales. The SEEK: Scalable Extraction of Enterprise Knowledge toolkit is reviewed as a mechanism to discover semantically heterogeneous source data. The SEEK approach complements existing data integration methods for persistent sharing of information. To make use of shared data on a per project basis, a schedule mapping approach is presented that integrates firms’ diverse individual schedules in a unified representation. The schedule mapping approach allows integration of process views that have different levels of detail, while allowing participants to maintain their own view of the process. Collectively, SEEK and the schedule mapping approach facilitate a broad range of analyses to support coordination of distributed schedules. While this paper focuses primarily on schedule process integration, the process connectors architecture is viewed as providing a broad solution to discovery and integration of firms’ process data.  相似文献   

15.
异构数据源集成实现的研究   总被引:3,自引:0,他引:3  
本文针对目前企业内因异构数据源所带来的信息共享问题,讨论了数据的系统异构、模式异构与来源异构三种表现,阐明了数据整合和集成的目的和意义,说明了常见的数据集成方式,提出了数据源的数据仓库集成、中间件集成、XML数据模型集成等方案,说明了这三种方式进行数据整合和集成的具体步骤与内容。该方法已经应用到具体系统开发中。  相似文献   

16.
一个基于CORBA的异构数据源集成系统的设计   总被引:28,自引:0,他引:28  
提出一个基于CORBA(common object request broker architecture)的即插即用的异构多数据源集成系统的设计方案.由于采用具有较强描述能力的OIM(object model for integration)对象模型作为集成系统的公共数据模型,该系统不仅能集成各种异构数据源,包括数据库系统、文件系统、WWW上HTML文件中的数据,而且能集成随时插入的新数据源中的数据.着重讨论系统的总体结构、OIM对象模型、查询处理及界面设计.  相似文献   

17.
18.
命名实体识别是文本信息处理的重要基础,也是自然语言处理的一项关键技术.近几年来微博迅速发展成为人们进行信息交流的平台,微博文本俨然已经成为进行命名实体抽取的新载体.论文利用微博内容和结构的特点,提出了一种基于统计与规则相结合的命名实体识别的方法.微博文本较短并且文本中含有标签、话题等内容,论文在考虑这些特点基础上,利用微博评论和转发进行词频统计,通过规则筛选,完成命名实体识别.在新浪微博数据上的实验结果表明该方法可以有效地提高微博中命名实体识别效果.  相似文献   

19.
针对目前基于本体的XML数据集成系统中,仅仅通过映射到全局模式来进行冲突消解的不足,该文提出了一种可扩展的映射规则模型。基于该模型,给出了一个冲突消解算法,可以较好地解决由于局部数据源间的冲突引起的局部数据源查询结果整合不正确和数据源间的连接操作失败等局部数据源互操作中出现的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号