共查询到17条相似文献,搜索用时 62 毫秒
1.
2.
目前针对国内在中文环境下本体学习的研究才刚刚起步的现状,对本体学习和HowNet进行了简单介绍,提出了基于HowNet的中文本体学习的主要思路.当前,本体学习的研究重点在于概念及概念间关系抽取.采用文本语料作为输入,首先对文本进行预处理,然后基于HowNet生成了一个领域语义词典,在本体学习中加入领域核心概念本体,在概念关系抽取阶段,采用基于HowNet的语义相似度计算方法.实验证明,提出的本体学习方法能够有效改进概念和概念间关系抽取的准确度. 相似文献
3.
4.
一种本体学习中分类关系提取方法的研究 总被引:2,自引:0,他引:2
本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的自动半自动构建,可解决本体手工构建的不足。根据本体学习目前的研究现状,提出了一种从文本中半自动获取本体中分类关系的实现,讨论了本体学习中概念抽取和概念间分类关系抽取等关键技术。实现了本体中分类关系提取,对于非分类关系的提取还有待研究。 相似文献
5.
本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的自动半自动构建,可解决本体手工构建的不足。根据本体学习目前的研究现状,提出了一种从文本中半自动获取本体中分类关系的实现,讨论了本体学习中概念抽取和概念间分类关系抽取等关键技术。实现了本体中分类关系提取,对于非分类关系的提取还有待研究。 相似文献
6.
由于中文和英文在语法和句法等方面的差异,面向中文文本的本体学习方法尚存在一定困难。研究了面向中文文本的玉米病虫害本体学习方法。提出单字合并法,将其与TFIDF方法结合,进行概念抽取;将欧几里德距离与余弦距离加权平均计算概念相似度,进行概念关系抽取。从中国玉米网选取50篇领域文档,应用上述方法构建了玉米病虫害本体。 相似文献
7.
该文依据关系判断任务特点将主动学习应用到本体概念关系的辅助判断中,对边缘采样、熵采样、最不确信采样等主动学习查询生成策略进行了比较研究。在此基础上,从实际应用角度出发,讨论了在三种不同样本初始情况下主动学习技术的应用。对于初始样本正反例充足的情况,采用基于熵采样和边缘采样产生查询;对于初始样本仅有正例的情况,依据样本相似度主动的学习策略生成候选反例;对于缺乏初始样本的情况,使用概念在样本间距离等统计信息,同时生成候选正例和候选反例。从而,实现了在概念关系判定过程中对用户反馈信息的有效利用。 相似文献
8.
本体研究已成为计算机领域的一个研究热点,而本体学习又是本体研究的热点问题之一。文章根据数据源的结构化程度,将数据源分为结构化、非结构化和半结构化数据源,分别研究了如何从这三种不同程度结构化的数据源中学习本体,探讨了后续研究工作的本体学习方法以及研究目标,并论述了目前研究存在的不足及对未来的展望。 相似文献
9.
语义Web的创建需要一套共同的标准概念体系,即本体(Ontology)。而现在本体的构造手段仍然是以手工构造为主,效率和准确率都非常低,很容易导致知识获取的瓶颈。近年来,自动创建领域本体可以克服手工方法的不足,成为当前的研究热点之一;本体学习是自动或半自动构建本体的一系列方法和技术。提出了一种利用知网,基于非结构化数据的特定领域概念及其之间关系的提取算法,从军事领域选取4个种子概念:舰、导弹、机和炮,并通过实验测试了该算法。 相似文献
10.
对本体(ontology)的研究在计算机领域变得越来越广泛,但手工构造本体是一项繁琐而辛苦的任务,还会导致知识获取瓶颈。本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体的(半)自动构建。本体的学习可以面向文本、知识库、结构化数据、半结构化数据和无结构数据。本文主要介绍了面向文本的本体学习,并对其中的学习内容、学习方法、学习工具、学习过程和系统评价等关键技术进行了说明,特别介绍了学习方法中的基于统计的方法、词汇句法模式法和形式概念分析法并对其优缺点做了简单的分析。 相似文献
11.
为了有效解决传统用户兴趣模型查不全,查不准等问题,引入农业本体技术构建用户兴趣模型。该模型能在语义层次上理解用户的兴趣,因而在检索时能获取较满意的查全率和查准率,能更好的体现农户的个性化需求。 相似文献
12.
13.
随着计算机及网络的普及,数字化出版成为知识的组织和出版的重要形式。文章尝试利用本体技术,通过扩展标准本体的概念关系集,用于建模教育教学领域的教育资源,将各类教育相关的资源整合成本体知识库,为数字化出版引擎奠定知识基础,实现教育知识和资源的按需聚合与出版。 相似文献
14.
提出一种通用的多策略本体学习框架,通过对Web上各专业领域文档集进行挖掘来实现本体自动构建。讨论本体学习中本体概念的抽取、概念之间语义关系的抽取和分类体系的自动构建等关键技术,通过实验对算法进行测试和评价。由于集成了多种机器学习算法,该方法在概念抽取和语义关系学习方面具有更高的准确性,采用通用本体WordNet和HowNet作为语料库,可适用于不同的专业领域。通过按需获取Web文档,该方法能实时生成本体。 相似文献
15.
16.
17.
现有的大多数本体都是通过手工构建的。本体的构建是一项费时费力的过程,特别在医学领域更是如此。对此,提出了基于中文分词和文本挖掘技术的自动领域本体构建方法,该方法能大大提高本体构建的效率,保证本体的构建质量。 相似文献