首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
Ontology近年来受到信息科学领域的广泛关注,其重要性已在许多方面表现出来并得到广泛认同。自动创建领域Ontology可以克服手工方法的不足,成为当前的研究热点之一;实例(Instance)是Ontology的重要组成元素,从领域文档集中学习实例是自动创建领域Ontology的关键之一。研制的一个领域Ontology的自动生成系统(OntoAGS)能够通过领域文档集自动地创建该领域的Ontology,OntoAGS系统的实例学习是基于模式匹配的算法。实验表明,与当前较流行的Ontology半自动生成系  相似文献   

2.
Ontology构建中概念与关系的获取与处理   总被引:7,自引:0,他引:7  
有效构建一个Ontology,需要对领域中的概念及其关系有清楚的理解。如果不能很好地抽取领域概念,往往不能开发出结构组织良好的Ontology。论文从Ontology的基本理论出发,基于基本概念、角色和关系,探讨了Ontology开发中的基本概念、角色概念、整体概念与部分概念等基本要素,并说明这些要素的处理,并为Ontology的开发提供了范例。  相似文献   

3.
语义Web是一个美好的构想,Ontology在语义Web中起着举足轻重的作用,它不仅能为人类用户而且能为软件agent提供从语法层次到语义层次上的互操作性。目前Web上主要是各种布局的HTML文档,未来的语义Web页面将是各种领域Ontology的实例以及到其它实例上的链接,因此语义Web的成功强烈依赖于Ontology的增殖,方便快捷地构造各领城Ontology是实现语义Web的关健。该文提出一种基于奇异值分解的中文Ontology自动学习技术,这种技术的特点是其简易性以及准确的数学理论基础。  相似文献   

4.
近些年来,语义Web和网格计算这两个方向在各自的研究社区分别发展着,这两方面的交叉即语义网格(semantic grid)则是最近一段时间兴起的研究领域.通过给网格附加语义层,能够促进网格自组织的形成.现有的Gnd社区都是使用集中式的、一致性的、可扩充的Ontology库.超越集中式的语义存储是语义网格发展面临的最大挑战之一.针对网格社区间的Ontology异构性这个问题,提出了一种多策略的Ontology匹配学习方法.它使用多种分类方法来学习Ontology之间的匹配:使用一般的基于统计的分类方法来发现数据实例内部的分类特征;或者使用基于一阶逻辑的学习算法FOIL来发现数据实例之间的语义联系.在单个方法预测的基础上,匹配系统使用称之为最突出的冠军的匹配委员会方法来集成分类结果.实验表明在现实的知识领域中,系统能达到很高的匹配精度.  相似文献   

5.
基于Ontology开发网络学习服务平台是网络教育应用的一个重要课题.基于基本概念、角色概念构建Ontology使表达语义更加精确.基于角色概念的Ontology元模型,构建了IT课程目标Ontology,实现了其语义Web应用.实验表明,基于角色概念构建的Ontology语义精度明显提高,以此为基础的网络学习服务平台能够较好地满足个性化学习的需求.  相似文献   

6.
随着教育技术的发展, 越来越多的人在学习过程中使用PPT文档. 对PPT文档进行概念图的构建, 使得学习者能快速且全面地了解一个PPT文档的知识要点, 有益于学习者加快学习速度, 有益于获取学习者的学习行为. 基于此, 提出了一种利用Microsoft Office编程技术、文本挖掘技术和社会网络分析技术自动提取PPT文档中的概念术语、概念术语之间的关系及构建概念图的算法. 实验结果表明: 该算法可以计算概念术语的重要性; 算法提取的概念术语具有一定的准确率, 提取到的越重要的概念术语的准确率越高.  相似文献   

7.
为了不改变语义性质和不造成概念冲突,Ontology不能汉译为“本体”。Ontology的“本体论”译名也不利于其在计算机工程领域中的实际应用。Ontology术语是作为本体论思维方式从哲学领域借用的。Ontology就是信息产品背后的、决定其性质的“概念系统”,将其理解为“本体论模型”不仅有方法论依据、语言学依据、模型方法依据,而且与Ontology的Gruber定义相一致。本体论模型是与数学模型、物理学模型并列的研究方法。  相似文献   

8.
为解决数据流分类过程中样本标注和概念漂移问题,提出了一种基于实例迁移的数据流分类挖掘模型.首先,该模型用支持向量机作学习器,用所得分类模型中的支持向量构建源领域,待分类的当前数据块为目标域.然后,借助互近邻思想在源域中挑选目标域中样本的真邻居进行实例迁移,避免发生负迁移.最后,通过合并目标域和迁移样本形成训练集,提高标注样本数量,增强模型的泛化能力.理论分析和实验结果表明,所提方法具有可行性,相比其它学习方法在分类准确性方面更具优势.  相似文献   

9.
基于非结构化数据的本体学习研究   总被引:4,自引:2,他引:2       下载免费PDF全文
语义Web的创建需要一套共同的标准概念体系,即本体(Ontology)。而现在本体的构造手段仍然是以手工构造为主,效率和准确率都非常低,很容易导致知识获取的瓶颈。近年来,自动创建领域本体可以克服手工方法的不足,成为当前的研究热点之一;本体学习是自动或半自动构建本体的一系列方法和技术。提出了一种利用知网,基于非结构化数据的特定领域概念及其之间关系的提取算法,从军事领域选取4个种子概念:舰、导弹、机和炮,并通过实验测试了该算法。  相似文献   

10.
随着Web资源的日益丰富,人们需要跨语言的知识共享和信息检索。一个多语言Ontology可以用来刻画不同语言相关领域的知识,克服不同文化和不同语言带来的障碍。对现有的构建多语言Ontology方法进行分析和比较,提出一种基于核心概念集的多语言Ontology的构建方法,用一个独立于特定语言的Ontology以及来自不同自然语言的定义和词汇的同义词集来描述相关领域的概念。用该方法构建的Ontology具有良好的扩展能力、表达能力和推理能力,特别适合分布式环境下大型Ontology的创建。  相似文献   

11.
Ontologies play a very important role in knowledge management and the Semantic Web, their use has been exploited in many current applications. Ontologies are especially useful because they support the exchange and sharing of information. Ontology learning from text is the process of deriving high-level concepts and their relations. An important task in ontology learning from text is to obtain a set of representative concepts to model a domain and organize them into a hierarchical structure (taxonomy) from unstructured information. In the process of building a taxonomy, the identification of hypernym/hyponym relations between terms is essential. How to automatically build the appropriate structure to represent the information contained in unstructured texts is a challenging task. This paper presents a novel method to obtain, from unstructured texts, representative concepts and their taxonomic relationships in a specific knowledge domain. This approach builds a concept hierarchy from a specific-domain corpus by using a clustering algorithm, a set of linguistic patterns, and additional contextual information extracted from the Web that improves the discovery of the most representative hypernym/hyponym relationships. A set of experiments were carried out using four different corpora. We evaluated the quality of the constructed taxonomies against gold standard ontologies, the experiments show promising results.  相似文献   

12.
Key concept extraction is a major step for ontology learning that aims to build an ontology by identifying relevant domain concepts and their semantic relationships from a text corpus. The success of ontology development using key concept extraction strongly relies on the degree of relevance of the key concepts identified. If the identified key concepts are not closely relevant to the domain, the constructed ontology will not be able to correctly and fully represent the domain knowledge. In this paper, we propose a novel method, named CFinder, for key concept extraction. Given a text corpus in the target domain, CFinder first extracts noun phrases using their linguistic patterns based on Part-Of-Speech (POS) tags as candidates for key concepts. To calculate the weights (or importance) of these candidates within the domain, CFinder combines their statistical knowledge and domain-specific knowledge indicating their relative importance within the domain. The calculated weights are further enhanced by considering an inner structural pattern of the candidates. The effectiveness of CFinder is evaluated with a recently developed ontology for the domain of ‘emergency management for mass gatherings’ against the state-of-the-art methods for key concept extraction including—Text2Onto, KP-Miner and Moki. The comparative evaluation results show that CFinder statistically significantly outperforms all the three methods in terms of F-measure and average precision.  相似文献   

13.
刘柏嵩 《计算机工程》2008,34(8):229-231
提出一种通用的多策略本体学习框架,通过对Web上各专业领域文档集进行挖掘来实现本体自动构建。讨论本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术,通过实验对算法进行测试和评价。由于集成了多种机器学习算法,该方法在概念抽取和语义关系学习方面具有更高的准确性,采用通用本体WordNet和HowNet作为语料库,可适用于不同的专业领域。通过按需获取Web文档,该方法能实时生成本体。  相似文献   

14.
The task of building an ontology from a textual corpus starts with the conceptualization phase, which extracts ontology concepts. These concepts are linked by semantic relationships. In this paper, we describe an approach to the construction of an ontology from an Arabic textual corpus, starting first with the collection and preparation of the corpus through normalization, removing stop words and stemming; then, to extract terms of our ontology, a statistical method for extracting simple and complex terms, called “the repeated segments method” are applied. To select segments with sufficient weight we apply the weighting method term frequency–inverse document frequency (TF–IDF), and to link these terms by semantic relationships we apply an automatic method of learning linguistic markers from text. This method requires a dataset of relationship pairs, which are extracted from two external resources: an Arabic dictionary of synonyms and antonyms and the lexical database Arabic WordNet. Finally, we present the results of our experimentation using our textual corpus. The evaluation of our approach shows encouraging results in terms of recall and precision.  相似文献   

15.
为了提高专业领域中文分词性能,以及弥补专业领域大规模标注语料难以获取的不足,该文提出基于深度学习以及迁移学习的领域自适应分词方法。首先,构建包含词典特征的基于深度学习的双向长短期记忆条件随机场(BI-LSTM-CRF)分词模型,在通用领域分词语料上训练得到模型参数;接着,以建设工程法律领域文本作为小规模分词训练语料,对通用领域语料的BI-LSTM-CRF分词模型进行参数微调,同时在模型的词典特征中加入领域词典。实验结果表明,迁移学习减少领域分词模型的迭代次数,同时,与通用领域的BI-LSTM-CRF模型相比,该文提出的分词方法在工程法律领域的分词结果F1值提高了7.02%,与预测时加入领域词典的BI-LSTM-CRF模型相比,分词结果的F1值提高了4.22%。该文提出的分词模型可以减少分词的领域训练语料的标注,同时实现分词模型跨领域的迁移。  相似文献   

16.
融合异构特征的子空间迁移学习算法   总被引:2,自引:0,他引:2  
特征迁移重在领域共有特征间学习,然而其忽略领域特有特征的判别信息,使算法的适应性受到一定的局限. 针对此问题,提出了一种融合异构特征的子空间迁移学习(The subspace transfer learning algorithm integrating with heterogeneous features,STL-IHF)算法.该算法将数据的特征空间看成共享和特有两个特征子空间的组合,同时基于经验风险最 小框架将共享特征和特有特征共同嵌入到支持向量机(Support vector machine,SVM)的训练过程中.其在共享特征子空间上实现知识迁移的 同时兼顾了领域特有的异构信息,增强了算法的适应性.模拟和真实数据集上的实验结果表明了所提方法的有效性.  相似文献   

17.
针对传统翻译系统在时态翻译中不准确的问题,结合当前的机器学习算法,提出一种基于DBN的平行语料库时态翻译方法。为实现该方法,首先对时态标注模型和DBN基本理论进行介绍,并提出汉英语句时态翻译的思路;而在进行DBN平行语料库特征提取的过程中,采用自动时态标注算法对时态进行标注,并对得到的数据进行时态树编码;然后以编码数据作为输入,运用DBN网络对时态进行训练预测,得到中文语句中可能的时态;最后通过Transformer翻译器对语句进行翻译,得到对应的翻译时态句子;最后结合LDC等平行语料库中的翻译句子,采用上述方法进行翻译,结果表明提出的时态翻译方法无论是在准确率,还是在召回率等方面,都有很大的优势,说明提出的机器学习算法在平行语料库的翻译中更具有准确性。  相似文献   

18.
In recent years, much effort has been put in ontology learning. However, the knowledge acquisition process is typically focused in the taxonomic aspect. The discovery of non-taxonomic relationships is often neglected, even though it is a fundamental point in structuring domain knowledge. This paper presents an automatic and unsupervised methodology that addresses the non-taxonomic learning process for constructing domain ontologies. It is able to discover domain-related verbs, extract non-taxonomically related concepts and label relationships, using the Web as corpus. The paper also discusses how the obtained relationships can be automatically evaluated against WordNet and presents encouraging results for several domains.  相似文献   

19.
大规模未标注语料中蕴含了丰富的词汇信息,有助于提高中文分词词性标注模型效果。该文从未标注语料中抽取词汇的分布信息,表示为高维向量,进一步使用自动编码器神经网络,无监督地学习对高维向量的编码算法,最终得到可直接用于分词词性标注模型的低维特征表示。在宾州中文树库5.0数据集上的实验表明,所得到的词汇特征对分词词性标注模型效果有较大帮助,在词性标注上优于主成分分析与k均值聚类结合的无监督特征学习方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号