首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 297 毫秒
1.
为了从半结构化的信息源中提取本体和统一地分析和处理所有信息源,该文为数据源提供了一个统一的概念模型,并定义了半结构化信息源到概念模型的转换规则。基于该模型,提出了计算模式中对象间精确语义相似性的方法。  相似文献   

2.
论文为不同格式的数据源提供了一个统一的概念模型,并定义了各种信息源到概念模型的转换规则。基于该模型,提出了计算模式间精确语义相似性的方法。  相似文献   

3.
由于XML已成为Web上表示结构化和半结构化数据的标准。设计XML模式的方法变得更加重要。为了设计或集成XML模式,常常需要基于合适的概念模型。本文分析了对XML概念模型的需求;提出了一种新的XML概念模型:XUML,并说明了XUML的主要特征和优点:能更明确地表示“包含”语义,支持“业务组件”概念,能在多级上下文中说明数据依赖,基于UML2标准;最后结合实例介绍了一种实现XUML的方法。  相似文献   

4.
信息集成研究综述   总被引:21,自引:0,他引:21  
信息集成所要解决的问题是把位于不同的异构信息源上的数据合并起来,以便为用户提供一个这些数据的统一视图。在当前的实际应用中,设计信息集成系统很重要,并且已经成为数据库领域的研究热点。本文对这一领域的研究做了综述,包括信息集成的方法、逻辑框架、查询处理,以及Web上半结构化数据的集成。最后,对将来的研究主题进行了展望。  相似文献   

5.
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。  相似文献   

6.
在基于MAS(Multi-Agent-System)的电子商务系统环境中,提出了一个针对半结构化信息的规范处理模式。通过这个处理模式,系统可以自主解决电子商务系统中数据的提取与转化、信息集成、数据关联管理等问题。这种信息处理模式结合了MAS设计思想,利用信息提取与转换器(Wrapper)屏蔽或解释半结构化信息中的异构部分的方法,设计信息源封装体系;通过提供一致的应用接口,使系统可以对信息源施加各种操作和管理,同时介绍了一个利用该模式设计的信息管理网站的结构。  相似文献   

7.
半结构化数据模型及查询语言   总被引:12,自引:0,他引:12  
在传统数据库中要求查询处理时数据的结构模式已知且固定。这在WWW和异构信息源集成等半结构化数据情形下很难满足。  相似文献   

8.
半结构化数据是网络中一种重要的数据形式,也是进行数据挖掘的重要基础。因此要对Internet上巨量的数据进行数据挖掘,半结构化数据及模型是前提。本文介绍了半结构化数据的相关概念及其数据模型。  相似文献   

9.
考虑到目前非结构化信息表示机制的不足,本文结合XML Schema和Ontology的各自优势,提出一个用于在分布式环境下进行语义信息处理的体系结构OBSA,解决了非结构化信息表示机制中信息源异构性及语义不确定性等问题.重点介绍了OBSA体系结构中基于F-Logic的语义信息表示机制以及一个在分布式环境下处理异质信息的语义适配器框架.  相似文献   

10.
互联网的兴起带来了大量的文本信息。在半结构化和非结构化的文本中提取对用户有用的信息,主要采用文本挖掘技术.本文对文本挖掘常用的方法进行比较分析,总结文本挖掘目前主要的应用领域  相似文献   

11.
Successful data warehouse (DW) design needs to be based upon a requirement analysis phase in order to adequately represent the information needs of DW users. Moreover, since the DW integrates the information provided by data sources, it is also crucial to take these sources into account throughout the development process to obtain a consistent reconciliation of data sources and information needs. In this paper, we start by summarizing our approach to specify user requirements for data warehouses and to obtain a conceptual multidimensional model capturing these requirements. Then, we make use of the multidimensional normal forms to define a set of Query/View/Transformation (QVT) relations to assure that the conceptual multidimensional model obtained from user requirements agrees with the available data sources that will populate the DW. Thus, we propose a hybrid approach to develop DWs, i.e., we firstly obtain the conceptual multidimensional model of the DW from user requirements and then we verify and enforce its correctness against data sources by using a set of QVT relations based on multidimensional normal forms. Finally, we provide some snapshots of the CASE tool we have used to implement our QVT relations.  相似文献   

12.
Successful data warehouse (DW) design needs to be based upon a requirement analysis phase in order to adequately represent the information needs of DW users. Moreover, since the DW integrates the information provided by data sources, it is also crucial to take these sources into account throughout the development process to obtain a consistent reconciliation of data sources and information needs. In this paper, we start by summarizing our approach to specify user requirements for data warehouses and to obtain a conceptual multidimensional model capturing these requirements. Then, we make use of the multidimensional normal forms to define a set of Query/View/Transformation (QVT) relations to assure that the conceptual multidimensional model obtained from user requirements agrees with the available data sources that will populate the DW. Thus, we propose a hybrid approach to develop DWs, i.e., we firstly obtain the conceptual multidimensional model of the DW from user requirements and then we verify and enforce its correctness against data sources by using a set of QVT relations based on multidimensional normal forms. Finally, we provide some snapshots of the CASE tool we have used to implement our QVT relations.  相似文献   

13.
提出一种基于知网的汉语普通未登录词语义分析模型,该模型以概念图为知识表示方法,以2005版知网为语义知识资源,首先参照知网知识词典对普通未登录词进行分词;然后综合利用知网中的知识词典等知识,通过词性序列匹配消歧法、概念图相容性判定消歧法、概念图相容度计算消歧法及语义相似度计算消歧法对中文信息结构进行消歧;最后根据所选择的中文信息结构生成未登录词的概念图,从而实现未登录词的语义分析。该模型在语义分析过程中一方面确定了未登录词中每个已登录词的词义,另一方面构造了该未登录词的语义信息,实验结果证明它可以作为普通未登录词语义分析的原型系统。  相似文献   

14.
The problem of handling both the integration and the cooperation of a large number of information sources characterised by heterogeneous representation formats is a challenging issue. In this context, a central role can be played by the knowledge about the semantic relationships holding between concepts belonging to different information sources (intersource properties). In this paper, we propose a semiautomatic approach for extracting two kinds of intersource properties, namely synonymies and homonymies, from heterogeneous information sources. In order to carry out the extraction task, we introduce both a conceptual model, for representing involved sources, and a metrics, for measuring the strength of the semantic relationships holding among concepts represented within the same source.  相似文献   

15.
在信息系统概念建模过程中,常常需要合并或重用已有模型形成复杂的模型,以更加精确地刻画物理世界模型,而概念模型间的相似度计算是实现这一目标的重要基础。通过引入LISA认知模型的系统相似性计算方法,将概念模型间相似度计算转化为关系,绑定,实体类和角色间相似度的综合计算。实验结果表明,这种计算方法综合考虑了各种相关因素,所得出的结果具有较高的可信度。  相似文献   

16.
基于k-最近邻(kNN)的分类方法是实现各种高性能模式识别技术的基础,然而这些方法很容易受到邻域参数k的影响,在完全不了解数据集特性的情况下想要得出各种数据集的邻域是比较困难的。基于上述问题,介绍了一种新的监督分类方法:扩展自然邻居(ENaN)方法,并证明了该方法在不人为选择邻域参数的情况下提供了一种更好的分类结果。与原有的基于kNN需要先验k的方法不同,ENaN方法在不同的阶段预测不同的k值。因此,无论是在训练阶段还是在测试阶段,ENaN方法都能从动态邻域信息中学习到更多的信息,从而提供更好的分类结果。在不同类型不同规模的真实数据上的分类检测结果均表明了ENaN方法的有效性。  相似文献   

17.
基于XML数据立方的面向对象扩展   总被引:3,自引:0,他引:3  
本文是对基于XML的数据立方数据模型的面向对象的实现,通过对数据仓库技术,面向对象技术和XML技术的结合的探讨,扩展了XML Schema,从而为基于WEB数据仓库的应用提供了一种新的表示和实现方法,解决了数据仓库中模式演化所带来的重组问题,通过与面向对象技术的结合使用,把数据仓库变成为数据立方和OLAP方法的仓库,这种数据仓库的实现方案,保证了数据仓库系统的稳定性,灵活性和可扩展性,适应了新一代WEB应用的需要。  相似文献   

18.
针对目前中文词语语义相似度方法中,基于信息内容的算法研究不足的问题,对知网信息模型上使用基于信息内容的中文词语相似度算法进行了研究。根据知网采用语义表达式表示知识而缺乏完整概念结构的特点,通过抽取知网语义表达式中的抽象概念,结合原知网义原树构建具有多重继承特征的知网义项网作为基于信息内容的计算本体。根据该义项网,对基于信息内容的词语相似度算法进行了改进,提出了新的信息内容含量计算方法。经过Miller&Charles(MC30)基准平台的测试,验证了基于信息内容方法在计算中文语义相似度方面的可行性,也证明了本文的计算策略和改进算法的合理性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号