共查询到18条相似文献,搜索用时 297 毫秒
1.
2.
论文为不同格式的数据源提供了一个统一的概念模型,并定义了各种信息源到概念模型的转换规则。基于该模型,提出了计算模式间精确语义相似性的方法。 相似文献
3.
4.
5.
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。 相似文献
6.
在基于MAS(Multi-Agent-System)的电子商务系统环境中,提出了一个针对半结构化信息的规范处理模式。通过这个处理模式,系统可以自主解决电子商务系统中数据的提取与转化、信息集成、数据关联管理等问题。这种信息处理模式结合了MAS设计思想,利用信息提取与转换器(Wrapper)屏蔽或解释半结构化信息中的异构部分的方法,设计信息源封装体系;通过提供一致的应用接口,使系统可以对信息源施加各种操作和管理,同时介绍了一个利用该模式设计的信息管理网站的结构。 相似文献
7.
8.
柏森 《计算机与信息技术》2007,(5)
半结构化数据是网络中一种重要的数据形式,也是进行数据挖掘的重要基础。因此要对Internet上巨量的数据进行数据挖掘,半结构化数据及模型是前提。本文介绍了半结构化数据的相关概念及其数据模型。 相似文献
9.
10.
互联网的兴起带来了大量的文本信息。在半结构化和非结构化的文本中提取对用户有用的信息,主要采用文本挖掘技术.本文对文本挖掘常用的方法进行比较分析,总结文本挖掘目前主要的应用领域 相似文献
11.
Successful data warehouse (DW) design needs to be based upon a requirement analysis phase in order to adequately represent the information needs of DW users. Moreover, since the DW integrates the information provided by data sources, it is also crucial to take these sources into account throughout the development process to obtain a consistent reconciliation of data sources and information needs. In this paper, we start by summarizing our approach to specify user requirements for data warehouses and to obtain a conceptual multidimensional model capturing these requirements. Then, we make use of the multidimensional normal forms to define a set of Query/View/Transformation (QVT) relations to assure that the conceptual multidimensional model obtained from user requirements agrees with the available data sources that will populate the DW. Thus, we propose a hybrid approach to develop DWs, i.e., we firstly obtain the conceptual multidimensional model of the DW from user requirements and then we verify and enforce its correctness against data sources by using a set of QVT relations based on multidimensional normal forms. Finally, we provide some snapshots of the CASE tool we have used to implement our QVT relations. 相似文献
12.
《Data & Knowledge Engineering》2008,64(3):725-751
Successful data warehouse (DW) design needs to be based upon a requirement analysis phase in order to adequately represent the information needs of DW users. Moreover, since the DW integrates the information provided by data sources, it is also crucial to take these sources into account throughout the development process to obtain a consistent reconciliation of data sources and information needs. In this paper, we start by summarizing our approach to specify user requirements for data warehouses and to obtain a conceptual multidimensional model capturing these requirements. Then, we make use of the multidimensional normal forms to define a set of Query/View/Transformation (QVT) relations to assure that the conceptual multidimensional model obtained from user requirements agrees with the available data sources that will populate the DW. Thus, we propose a hybrid approach to develop DWs, i.e., we firstly obtain the conceptual multidimensional model of the DW from user requirements and then we verify and enforce its correctness against data sources by using a set of QVT relations based on multidimensional normal forms. Finally, we provide some snapshots of the CASE tool we have used to implement our QVT relations. 相似文献
13.
提出一种基于知网的汉语普通未登录词语义分析模型,该模型以概念图为知识表示方法,以2005版知网为语义知识资源,首先参照知网知识词典对普通未登录词进行分词;然后综合利用知网中的知识词典等知识,通过词性序列匹配消歧法、概念图相容性判定消歧法、概念图相容度计算消歧法及语义相似度计算消歧法对中文信息结构进行消歧;最后根据所选择的中文信息结构生成未登录词的概念图,从而实现未登录词的语义分析。该模型在语义分析过程中一方面确定了未登录词中每个已登录词的词义,另一方面构造了该未登录词的语义信息,实验结果证明它可以作为普通未登录词语义分析的原型系统。 相似文献
14.
Luigi Palopoli Domenico Rosaci Giorgio Terracina Domenico Ursino 《Knowledge and Information Systems》2005,8(4):462-497
The problem of handling both the integration and the cooperation of a large number of information sources characterised by
heterogeneous representation formats is a challenging issue. In this context, a central role can be played by the knowledge
about the semantic relationships holding between concepts belonging to different information sources (intersource properties).
In this paper, we propose a semiautomatic approach for extracting two kinds of intersource properties, namely synonymies and
homonymies, from heterogeneous information sources. In order to carry out the extraction task, we introduce both a conceptual
model, for representing involved sources, and a metrics, for measuring the strength of the semantic relationships holding
among concepts represented within the same source. 相似文献
15.
在信息系统概念建模过程中,常常需要合并或重用已有模型形成复杂的模型,以更加精确地刻画物理世界模型,而概念模型间的相似度计算是实现这一目标的重要基础。通过引入LISA认知模型的系统相似性计算方法,将概念模型间相似度计算转化为关系,绑定,实体类和角色间相似度的综合计算。实验结果表明,这种计算方法综合考虑了各种相关因素,所得出的结果具有较高的可信度。 相似文献
16.
基于k-最近邻(kNN)的分类方法是实现各种高性能模式识别技术的基础,然而这些方法很容易受到邻域参数k的影响,在完全不了解数据集特性的情况下想要得出各种数据集的邻域是比较困难的。基于上述问题,介绍了一种新的监督分类方法:扩展自然邻居(ENaN)方法,并证明了该方法在不人为选择邻域参数的情况下提供了一种更好的分类结果。与原有的基于kNN需要先验k的方法不同,ENaN方法在不同的阶段预测不同的k值。因此,无论是在训练阶段还是在测试阶段,ENaN方法都能从动态邻域信息中学习到更多的信息,从而提供更好的分类结果。在不同类型不同规模的真实数据上的分类检测结果均表明了ENaN方法的有效性。 相似文献
17.
基于XML数据立方的面向对象扩展 总被引:3,自引:0,他引:3
本文是对基于XML的数据立方数据模型的面向对象的实现,通过对数据仓库技术,面向对象技术和XML技术的结合的探讨,扩展了XML Schema,从而为基于WEB数据仓库的应用提供了一种新的表示和实现方法,解决了数据仓库中模式演化所带来的重组问题,通过与面向对象技术的结合使用,把数据仓库变成为数据立方和OLAP方法的仓库,这种数据仓库的实现方案,保证了数据仓库系统的稳定性,灵活性和可扩展性,适应了新一代WEB应用的需要。 相似文献
18.
针对目前中文词语语义相似度方法中,基于信息内容的算法研究不足的问题,对知网信息模型上使用基于信息内容的中文词语相似度算法进行了研究。根据知网采用语义表达式表示知识而缺乏完整概念结构的特点,通过抽取知网语义表达式中的抽象概念,结合原知网义原树构建具有多重继承特征的知网义项网作为基于信息内容的计算本体。根据该义项网,对基于信息内容的词语相似度算法进行了改进,提出了新的信息内容含量计算方法。经过Miller&Charles(MC30)基准平台的测试,验证了基于信息内容方法在计算中文语义相似度方面的可行性,也证明了本文的计算策略和改进算法的合理性。 相似文献