首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
构造虚拟样本能够为机器学习中的训练集融入先验知识,从而改善标注瓶颈问题.提出了一种本体驱动的文本虚拟样本构造方法.在确保类别不变性的前提下,该方法依据领域相关本体所明晰表达的领域知识,基于本体树的点、边、子树,从同义、父子、语义同构的多个词义关系角度实现了文本虚拟样本的构造.初步实验表明,该方法与原分类及类似方法相比具有更好的分类精度和推广能力.  相似文献   

2.
针对传统通用网络爬虫的自身固有的缺陷,结合本体的相关理论,提出了一种基于语义本体的网络爬虫的相关模型。该模型以本体构建领域知识概念集,结合知网,从语义的角度,利用扩展的元数据,在词的语义层次,对抓取的页面链接进行语义相关性计算,预测与主题相关的URL,提高采集的网络资源信息与设定主题的相关度。实验结果表明,该模型同其它通用网络爬虫模型相比具有较高的信息抓取准确率。  相似文献   

3.
基于本体的语义检索技术   总被引:1,自引:0,他引:1  
基于本体的语义检索是建立在语义Web的基础上的检索技术。与传统的检索技术相比,它能提高检索的精度,减少了不相关的返回结果。使用句子成分进行实体的实例的初步创建,然后通过已经构造好的领域本体把实例和实体进行映射,从而构建领域本体的实例,通过对实例进行索引,达到概念级检索的目的。首先介绍了语义Web和本体的基本概念。然后详细讨论了基于本体的语义检索的实现的具体步骤及方法。最后分析了该方法的不足。  相似文献   

4.
本体论与各个领域计算机技术的发展结合产生了所谓的“领域本体”的构建及应用研究, 首先介绍了计算机本体理论的基本概念, 接着给出石油勘探开发知识管理系统的框架设计, 然后提出基于多层次业务流程的石油勘探和开发领域知识本体库的构建方法, 把石油勘探开发领域所涉及方面分为多级业务活动层次, 并以采油工程方案为例列出了对应的知识本体库构建方法的探讨.  相似文献   

5.
以本体为核心的图像情感语义检索模型   总被引:1,自引:0,他引:1  
针对目前图像检索系统较难实现情感语义检索的问题,构建了以本体为核心的图像情感语义检索模型。在对核心本体库的构建中,采用将Mpeg-7和概念格理论与本体构建相结合的方法,其难点在于将Mpeg-7标准描述符与图像情感本体的属性构造的结合,以及自动产生新的概念结果的方法;实现了图像情感领域本体框架的半自动构建。通过系统的初步实现与相关实验的验证,证明了此检索模型在实现图像情感语义检索中的可行性和优越性。  相似文献   

6.
介绍了领域本体构建的基本流程,目的是为了更好地服务于语义web以及搜索引擎等。主要内容包括本体的概念、分类、功能及本体构建的方法、语言和工具,并以Java领域本体库的构建为例详细阐述了本体的构建过程。  相似文献   

7.
丁文文 《微计算机信息》2007,23(24):191-193
针对目前语义Web服务发现机制只能基于一个本体发布,查找的缺点,结合WordNet本体库与OWL-S语义描述语言设计一个语义明确的Web服务发现模型。该模型中采用OWL-S对Web服务进行语义描述,对领域相关本体中的概念进行预处理,以WordNet提供的术语语义为基础,建立一个全局领域相关本体。这种全局领域本体建立方法避免了因对概念理解不统一而产生的不一致性,得到的本体易于扩展。  相似文献   

8.
提出一种基于本体的视频检索方法,利用本体的基本概念获取样本图像组,并建立样本图像组和未标注视频的共同特征空间来实现视频的标注;在视频标注的基础上,对视频领域本体的基本概念集进行扩展来提高查询的命中率,以对扩展概念集记录进行检索的方式完成视频的检索。  相似文献   

9.
一个本体语言及本体构造工具的设计   总被引:2,自引:0,他引:2  
  相似文献   

10.
面向语义信息查询的模糊本体模型   总被引:4,自引:0,他引:4       下载免费PDF全文
杨青  陈薇  闻彬 《计算机工程》2010,36(8):188-190
针对领域知识建模时的模糊性、不确定性与信息查询时的局限性,提出一种基于模糊控制规则的模糊本体模型。利用基于模糊聚类的本体机器学习方法构建模糊控制规则库,通过计算模糊相似矩阵得到模糊概念的语义关联,对词汇相关概念进行语义分析与扩展获取模糊概念间的本质语义关系,实现基于模糊概念属性值的信息查询与语义共用。实验结果表明,该模型在语义查询上有更完善的推理机制,能有效获取语义信息。  相似文献   

11.
针对当前《知网》的词语语义描述与人们对词汇的主观认知之间存在诸多不匹配的问题,在充分利用丰富的网络知识的背景下,提出了一种融合《知网》和搜索引擎的词汇语义相似度计算方法。首先,考虑了词语与词语义原之间的包含关系,利用改进的概念相似度计算方法得到初步的词语语义相似度结果;然后,利用基于搜索引擎的相关性双重检测算法和点互信息法得出进一步的语义相似度结果;最后,设计了拟合函数并利用批量梯度下降法学习权值参数,融合前两步的相似度计算结果。实验结果表明,与单纯的基于《知网》和基于搜索引擎的改进方法相比,融合方法的斯皮尔曼系数和皮尔逊系数均提升了5%,同时提升了具体词语义描述与人们对词汇的主观认知之间的匹配度,验证了将网络知识背景融入到概念相似度计算方法中能有效提高中文词汇语义相似度的计算性能。  相似文献   

12.
针对民航突发事件应急管理领域本体的自动更新问题,提出了基于LDA的领域本体概念获取方法。以文本信息作为数据源,采用NLPIR自适应分词与过滤方法获取候选术语集,设计了领域本体的LDA主题模型,通过吉布斯采样进行LDA模型训练与主题推断,实现了领域本体核心概念的相关术语提取;基于LDA主题概率分布研究了语义关系识别规则的构建方法,给出了概念及其相关术语语义关系的识别与实现过程。实验效果表明,该方法可以有效解决大规模领域本体概念的自动更新问题,为大数据环境下民航突发事件跨媒体信息的共享与推理提供了良好的数据支持。  相似文献   

13.
语义检索的关键技术就是语义扩展。文中利用基于带衰减因子的词共现模型计算公式来获得词与词之间相关性信息资源.从而给出了用于信息检索系统中的语义关系库完整的自动构建方法。将生成的语义关系库用于SMART信息检索系统中以实现语义扩展:实验结果证明:具有语义关系库的SMART信息检索系统比原不具有语义关系库的SMART信息检索系统提高了检索效率,特别是大大地提高了查全率。  相似文献   

14.
针对传统基于wordnet的词汇语义相似度计算方法中隔离抽象词汇和具象词汇,以及片面依赖上下义关系的不足,提出了基于交通领域知识网络的词汇语义相似度计算方法.基于上下义、工具-工具对象、部件-整体等概念关系准则构建了交通词汇的知识网络图谱,提出了修正的平均路径长度参量计算网络中词汇的语义相似度,得到更高的语义一致性结果.实验表明,在Finkelstein的353对词汇集上,本文算法能够获得比传统方法更符合人工判断的语义相似度.  相似文献   

15.
基于对语料的统计分析,提出了词关联度的概念。通过对文本库中词语出现的频率,以及任意两个词语共同出现的频率进行统计,获得了各个词语之间的关联度,并使用这一参数对语义向量进行调整,可以有效地解决传统向量空间模型的单词依赖问题。结合倒排索引技术,实际建立了一个相当规模的文本检索系统。测试结果表明,系统具有较好的效果和良好的性能,具备实用价值。  相似文献   

16.
关系分类是自然语言处理领域的一项重要语义处理任务。传统的关系分类方法通过人工设计各类特征以及各类核函数来对句子内部2个实体之间的关系进行判断。近年来,关系分类方法的主要工作集中于通过各类神经网络获取句子的语义特征表示来进行分类,以减少手动构造各类特征。在句子中,不同关键词对关系分类任务的贡献程度是不同的,然而重要的词义有可能出现在句子中的任意位置。为此,提出了一种基于注意力的混合神经网络关系分类模型来捕获重要的语义信息,用来进行关系分类,该方法是一种端到端的方法。实验结果表明了该方法的有效性。  相似文献   

17.
The Princeton WordNet® (PWN) is a widely used lexical knowledge database for semantic information processing. There are now many wordnets under creation for languages worldwide. In this paper, we endeavor to construct a wordnet for Pre-Qin ancient Chinese (PQAC), called PQAC WordNet (PQAC-WN), to process the semantic information of PQAC. In previous work, most recently constructed wordnets have been established either manually by experts or automatically using resources from which translation pairs between English and the target language can be extracted. The former method, however, is time-consuming, and the latter method, owing to a lack of language resources, cannot be performed on PQAC. As a result, a method based on word definitions in a monolingual dictionary is proposed. Specifically, for each sense, kernel words are first extracted from its definition, and the senses of each kernel word are then determined by graph-based Word Sense Disambiguation. Finally, one optimal sense is chosen from the kernel word senses to guide the mapping between the word sense and PWN synset. In this research, we obtain 66 % PQAC senses that can be shared with English and another 14 % language-specific senses that were added to PQAC-WN as new synsets. Overall, the automatic mapping achieves a precision of over 85 %.  相似文献   

18.
针对民航突发事件领域本体关系抽取准确率低的问题,提出了一种结合注意力机制与双向门控循环单元(BiGRU)的关系抽取模型。首先查询预先训练的词向量矩阵,将文本中每个词语映射为向量表示;其次构建BiGRU,得到词语序列的上下文语义信息;然后在词语层面和句子层面分别引入注意力机制,为表达语义关系更重要的词语和句子分配更大的权重;最后进行模型的训练与优化。将该模型应用在民航突发事件领域本体的关系提取中,实验结果表明该模型相较于其他方法具有更好的提取效果,验证了该模型的有效性,为民航突发事件领域本体关系的自动获取提供了新的方法支持。  相似文献   

19.
Semantic-oriented service matching is one of the challenges in automatic Web service discovery. Service users may search for Web services using keywords and receive the matching services in terms of their functional profiles. A number of approaches to computing the semantic similarity between words have been developed to enhance the precision of matchmaking, which can be classified into ontology-based and corpus-based approaches. The ontology-based approaches commonly use the differentiated concept information provided by a large ontology for measuring lexical similarity with word sense disambiguation. Nevertheless, most of the ontologies are domain-special and limited to lexical coverage, which have a limited applicability. On the other hand, corpus-based approaches rely on the distributional statistics of context to represent per word as a vector and measure the distance of word vectors. However, the polysemous problem may lead to a low computational accuracy. In this paper, in order to augment the semantic information content in word vectors, we propose a multiple semantic fusion (MSF) model to generate sense-specific vector per word. In this model, various semantic properties of the general-purpose ontology WordNet are integrated to fine-tune the distributed word representations learned from corpus, in terms of vector combination strategies. The retrofitted word vectors are modeled as semantic vectors for estimating semantic similarity. The MSF model-based similarity measure is validated against other similarity measures on multiple benchmark datasets. Experimental results of word similarity evaluation indicate that our computational method can obtain higher correlation coefficient with human judgment in most cases. Moreover, the proposed similarity measure is demonstrated to improve the performance of Web service matchmaking based on a single semantic resource. Accordingly, our findings provide a new method and perspective to understand and represent lexical semantics.  相似文献   

20.
由于维吾尔语形态丰富且资源匮乏,因此直接使用现有的深度学习模型并不能很好地完成文本分类任务。基于此,该文提出了MDPLC文本分类模型,即首先将预先训练的词向量和经Bi-LSTM处理得到的语义信息进行融合,进而得到全句语义依赖,然后通过组合池化的CNN进一步加强局部语义学习,同时以双通道的方式使用多卷积核DPCNN捕获文本语义信息,最后融合两种模型提取到的信息完成文本分类任务。为验证该模型的有效性,该文分别采用中文、英文和维吾尔文短、长文本数据集进行实验,实验结果表明,该模型在多个分类任务中取得的性能都高于现有主流深度学习模型,验证了该模型在不同语种、语义表达稀疏和语义丰富各种情况下的鲁棒性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号