共查询到18条相似文献,搜索用时 156 毫秒
1.
为了从半结构化的信息源中提取本体,统一地分析和处理所有信息源,本文为数据源提供了一个统一的概念模型,并定义了半结构化信息源到概念模型的转换规则。基于该模型,本文提出了计算模式中对象间精确语义相似性的方法。 相似文献
2.
论文为不同格式的数据源提供了一个统一的概念模型,并定义了各种信息源到概念模型的转换规则。基于该模型,提出了计算模式间精确语义相似性的方法。 相似文献
3.
4.
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。 相似文献
5.
在基于MAS(Multi-Agent-System)的电子商务系统环境中,提出了一个针对半结构化信息的规范处理模式。通过这个处理模式,系统可以自主解决电子商务系统中数据的提取与转化、信息集成、数据关联管理等问题。这种信息处理模式结合了MAS设计思想,利用信息提取与转换器(Wrapper)屏蔽或解释半结构化信息中的异构部分的方法,设计信息源封装体系;通过提供一致的应用接口,使系统可以对信息源施加各种操作和管理,同时介绍了一个利用该模式设计的信息管理网站的结构。 相似文献
6.
7.
8.
一个基于模式的XML存储模型 总被引:4,自引:0,他引:4
XML基于半结构化数据模型,而半结构化数据很难统一存储和管理。文章提出了一个基于模式的XML存储模型SBSM,并定义了如何在该模型上进行相关的操作,该模型克服了对象-关系映射模型的局限性,并支持直接在模型上进行查询操作。 相似文献
9.
10.
1.引言随着Internet的发展和异构信息源(从传统的RDBMS到半结构化信息源)集成技术的提高,对Web环境下的信息进行集成、分析处理并提供决策服务己成为当前的研究热点。Web信息集成最初采取Mediator/Wrapper框架的虚拟方案。Ullman在提交给VLDB‘97的论文中指出,“Media-tor实际上是一个或多个信息源上的视图”。用户通过Media-tor提供的数据模式访问数据源。Wrapper实现Mediator数据模式与源数据的映象。当用户提交一个查询时,Mediator确定哪些数据源与该查询相关,把查询分解为各数据源上的子查询,提交给相应的Wrapper处理。 相似文献
11.
提出一种基于知网的汉语普通未登录词语义分析模型,该模型以概念图为知识表示方法,以2005版知网为语义知识资源,首先参照知网知识词典对普通未登录词进行分词;然后综合利用知网中的知识词典等知识,通过词性序列匹配消歧法、概念图相容性判定消歧法、概念图相容度计算消歧法及语义相似度计算消歧法对中文信息结构进行消歧;最后根据所选择的中文信息结构生成未登录词的概念图,从而实现未登录词的语义分析。该模型在语义分析过程中一方面确定了未登录词中每个已登录词的词义,另一方面构造了该未登录词的语义信息,实验结果证明它可以作为普通未登录词语义分析的原型系统。 相似文献
12.
Successful data warehouse (DW) design needs to be based upon a requirement analysis phase in order to adequately represent the information needs of DW users. Moreover, since the DW integrates the information provided by data sources, it is also crucial to take these sources into account throughout the development process to obtain a consistent reconciliation of data sources and information needs. In this paper, we start by summarizing our approach to specify user requirements for data warehouses and to obtain a conceptual multidimensional model capturing these requirements. Then, we make use of the multidimensional normal forms to define a set of Query/View/Transformation (QVT) relations to assure that the conceptual multidimensional model obtained from user requirements agrees with the available data sources that will populate the DW. Thus, we propose a hybrid approach to develop DWs, i.e., we firstly obtain the conceptual multidimensional model of the DW from user requirements and then we verify and enforce its correctness against data sources by using a set of QVT relations based on multidimensional normal forms. Finally, we provide some snapshots of the CASE tool we have used to implement our QVT relations. 相似文献
13.
《Data & Knowledge Engineering》2008,64(3):725-751
Successful data warehouse (DW) design needs to be based upon a requirement analysis phase in order to adequately represent the information needs of DW users. Moreover, since the DW integrates the information provided by data sources, it is also crucial to take these sources into account throughout the development process to obtain a consistent reconciliation of data sources and information needs. In this paper, we start by summarizing our approach to specify user requirements for data warehouses and to obtain a conceptual multidimensional model capturing these requirements. Then, we make use of the multidimensional normal forms to define a set of Query/View/Transformation (QVT) relations to assure that the conceptual multidimensional model obtained from user requirements agrees with the available data sources that will populate the DW. Thus, we propose a hybrid approach to develop DWs, i.e., we firstly obtain the conceptual multidimensional model of the DW from user requirements and then we verify and enforce its correctness against data sources by using a set of QVT relations based on multidimensional normal forms. Finally, we provide some snapshots of the CASE tool we have used to implement our QVT relations. 相似文献
14.
Luigi Palopoli Domenico Rosaci Giorgio Terracina Domenico Ursino 《Knowledge and Information Systems》2005,8(4):462-497
The problem of handling both the integration and the cooperation of a large number of information sources characterised by
heterogeneous representation formats is a challenging issue. In this context, a central role can be played by the knowledge
about the semantic relationships holding between concepts belonging to different information sources (intersource properties).
In this paper, we propose a semiautomatic approach for extracting two kinds of intersource properties, namely synonymies and
homonymies, from heterogeneous information sources. In order to carry out the extraction task, we introduce both a conceptual
model, for representing involved sources, and a metrics, for measuring the strength of the semantic relationships holding
among concepts represented within the same source. 相似文献
15.
在信息系统概念建模过程中,常常需要合并或重用已有模型形成复杂的模型,以更加精确地刻画物理世界模型,而概念模型间的相似度计算是实现这一目标的重要基础。通过引入LISA认知模型的系统相似性计算方法,将概念模型间相似度计算转化为关系,绑定,实体类和角色间相似度的综合计算。实验结果表明,这种计算方法综合考虑了各种相关因素,所得出的结果具有较高的可信度。 相似文献
16.
由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步:基于WordNet对用户查询q进行同义词扩展得到q';将q'和D中的每一篇XML文档都进行数字签名,并通过签名之间的匹配对D进行有效过滤,除去大量不符合用户查询的文档,得到一个文档子集D',[D'?D];对q'与D'中的文档进行精确匹配得到检索结果。 相似文献
17.