首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
基于本体关系匹配的信息抽取   总被引:3,自引:0,他引:3       下载免费PDF全文
何召卫  陈俊亮 《计算机工程》2007,33(21):207-209
目前,稳定可靠的信息抽取是一个有待解决的问题,该文提出了基于本体关系匹配信息抽取算法,应用语义Web把信息抽取目标文档描述为特殊的本体格式,采用机器学习理论对本体进行分析和处理。测试数据集的实验结果显示,本体关系集匹配算法优于其他4种信息抽取算法。  相似文献   

2.
刘伟  贺露 《软件》2013,(12):211-212
所谓基于本体的Web信息研究其实质就是对所构建的本体为信息抽取核心,本文通过对信息抽取系统的相关概念理论进行基础分析,分类比较基于本体的信息抽取系统,对基于本体的Web信息抽取系统分析研究,主要研究其整体构造、技术方法的分析和评价两方面内容。  相似文献   

3.
为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法.该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,然后结合DOM树技术和抽取路径的启发式学习,获得Web贞面中信息项的抽取路径.通过信息项的抽取路径自动生成信息项的领域本体,通过信息项的领域本体解析出信息项的抽取规则.使用本算法来进行Web信息的抽取,具有查全率与查准率高、时间复杂度低、用户负担较轻和自动化程度高的特点.  相似文献   

4.
张鑫  陈梅  王翰虎  王嫣然 《微机发展》2011,(2):58-61,65
为了解决网页信息的自动抽取,该文提出了一种基于视觉特征和领域本体的Web信息抽取算法。该算法以基于领域本体的信息抽取为基础,根据网页的视觉特征来准确划定信息抽取区域,然后结合DOM树技术和抽取路径的启发式学习,获得Web页面中信息项的抽取路径。通过信息项的抽取路径自动生成信息项的领域本体,通过信息项的领域本体解析出信息项的抽取规则。使用本算法来进行Web信息的抽取,具有查全率与查准率高、时间复杂度低、用户负担较轻和自动化程度高的特点。  相似文献   

5.
智慧旅游发展背景下,旅游本体有助于解决信息服务中的不足。信息抽取作为本体构建过程中的关键技术,极具研究价值。文章以旅游领域为对象,给出本体构建的基本思路,从文本资源采集、领域术语抽取和领域概念层次关系抽取3个过程探讨多元信息抽取技术在旅游本体构建中的具体应用。  相似文献   

6.
针对Web信息抽取主要依据内容进行抽取的思想,通过对基于本体的Web信息抽取技术的分析,在对网页进行预处理的过程中引入网页分块思想。通过网页分块技术准确提取出所需信息的抽取区域,再根据本体抽取规则对得到的抽取区域进行处理,最终得到需要的信息。实验验证了改进的基于本体的Web信息抽取算法具有更高的准确率和召回率,具有良好的应用前景。  相似文献   

7.
基于本体的旅游信息抽取   总被引:1,自引:0,他引:1  
基于本体的信息抽取技术是一种把本体和信息处理技术结合起来实现信息抽取的一种方法。提出一种基于本体的旅游领域信息抽取方法。该方法依据旅游本体的关键词定位页面信息区域,从网页中抽取正文信息,对其进行分词处理及过滤,再根据Java标注模式引擎JAPE(Java Annotation Patterns Engine)编写的规则进行本体匹配,形成结构化的内容,存入数据库。最后,通过实验证明了所提出的方法的准确性。  相似文献   

8.
在利用本体进行信息抽取的基础上,提出了一个基于个人信息领域的语义信息抽取系统框架,将语义抽取从WEB领域扩展到个人信息领域;系统对个人信息领域内的网页,电子邮件,本地数据库和本地文件夹建立本体,根据本体之间的语义关联,实现个人信息领域内数据的交流。系统详细描述了语义信息抽取系统的实现过程,并以电子邮件为例重点介绍了语义信息抽取的算法。  相似文献   

9.
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严重挑战。Ontology作为领域知识的共同理解,能有效地解决现在信息抽取所面临的主要挑战——知识工程的瓶颈问题。文中详细介绍了本体的定义和建模语言,分析了现有基于本体信息抽职的几种典型方法,得出了其所存在的主要问题。  相似文献   

10.
一种从关系数据库向Flogic本体转换的方法   总被引:3,自引:0,他引:3  
目前提出的从关系数据库中获取本体的方法主要关注主键之间的相关性,导致抽取的语义信息不全。本文提出一种将关系数据库向Flogic表示的本体转换的方法,该方法通过对主键、数据、属性相关性的综合分析,可以抽取出关系数据库中隐含的语义信息,如继承关系及优化结构。  相似文献   

11.
利用本体论的方法来实现企业信息系统,提出了企业信息系统的框架体系,及关键技术。定义了企业本体及其概念的框架表示,描述了企业信息系统中的数据库与企业本体集成时建立领域本体的步骤,阐述了本体管理系统中应用本体的功能。  相似文献   

12.
基于叙词表的领域本体构建方法研究   总被引:1,自引:0,他引:1  
提出了一种利用现有术语丰富的叙词表构建领域本体的方法,该方法可以减少构建领域本体的工作量.通过基于<农业科学叙词表>构建果树学领域本体的实例,对一种基于叙词表的领域本体构建方法的设计过程进行了详细叙述,该方法分为3个阶段,即领域本体的信息收集和分析、领域本体的详细设计、领域本体的表示,其中详细设计是核心,该阶段将叙词表中出现的核心词汇、语义关系转化到本体中,并补充了更丰富的语义关系.  相似文献   

13.
可重用本体模块的抽取是本体重用的一个关键环节。与传统工程应用中使用的基于本体层次的结构化方法抽取本体模块相比,使用逻辑的方法能充分利用本体提供的语义信息,抽取的本体模块更具完整性和正确性。在研究保守扩展的本体模块理论基础上,根据Grau B C提出的 SHOJQ 本地性规则,提出并证明了描述逻辑SHJF对应的语义本地性规则和句法本地性规则,为基于该规则抽取可重用本体模块提供了理论基础。  相似文献   

14.
基于Ontology的建模方法   总被引:1,自引:1,他引:0  
李明  赵丽 《计算机工程与设计》2006,27(9):1575-1577,1580
Ontology作为一种描述概念与概念之间关系的模型,能够解决知识共享和重用问题,近年来已被广泛应用于计算机科学的众多领域中,如数字图书馆、软件复用、Web异构信息的处理和语义Web等.介绍了Ontology的定义、分类及组成,并且介绍了建立本体的步骤,通过一个具体的实例详细阐述了建立本体的过程,最后给出了建立本体的构造图.  相似文献   

15.
本体映射是本体集成的一个关键环节.本体映射是实现不同本体之间共享和交流的基础,为相似或不同应用领域间的知识共享铺平道路,方便知识的获取.介绍了两个汽车领域本体之间进行映射的一种方法,该方法使用了基于语法匹配的方法并利用实例信息确定所映射的概念.最后结合了具体的例子来说明了核心算法.  相似文献   

16.
王晓盈  王晓璇  刘鹏 《微机发展》2010,(2):121-124,128
本体是解决语义层次上web信息共享和交换的基础,随着本体研究的发展,中文本体应用需求不断扩大。对于本体工程的第一步——本体构建,现已出现很多本体构建工具,如:Protege-2000、WebODE、OilEd、OntoEdit以及KAON等。然而,却缺乏一款功能完整的中文本体构建工具。文中对现有本体构建工具进行了比较分析,并对Protege的中文本体构建能力进行评估,深入探讨了其构建中文本体过程中遇到的可视化问题,提出了可行性解决方案。全面讨论了中文本体构建工具现存的问题,指出了未来的研究方向。  相似文献   

17.
In this paper we present an enhanced multi-modality ontology-based approach for web image retrieval step by step. Several ontology-based approaches have been made in the field of multimedia retrieval. Our multi-modality approach is one of the earliest attempts to integrate information from different modalities and apply the model in a complex domain. In order to develop the model, we need to answer the following questions: (1) how to find the proper structure and construct an ontology which can integrate information from different modalities; (2) how to quantify the matching degree (concept similarity) and provide an independent ranking mechanism; (3) how to ensure the scalability of this approach when applied to large domains. The first question has been answered by our multi-modality ontology which has been discussed in Wang et al. (Does ontology help in image retrieval? In: Asia-Pacific workshop on visual information processing, 2006) and its extension (Wang et al., Does ontology help in image retrieval?—a comparison between keyword, text ontology and multi-modality ontology approaches, ACM Press, New York, NY, USA, pp 109–112, 2006). More details about this work is given later. The main focus of this paper is that we propose a new ranking mechanism using Spearman’s ranking correlation to measure the similarity of concepts in the ontology. We take the priorities of information from different modalities into consideration. This algorithm gives the answer of the second question. The semantic matchmaking result is quantized and the degree of similarity between concepts is calculated. For the third question, importing of ontology will resolve the scalability issue but computing concept similarity and identify relationships when integrating different ontologies will be beyond the scope of this paper. To convince readers that our multi-modality ontology and concept similarity ranking is the right step forward, we decided to work on the animal kingdom. We believe this domain is challenging as demonstrated by images depict animals in a wide range of aspects, pose, configurations and appearances. We experimented with a data sets of 4,000 web images. Based on ground truth, we analyze the image content and text information, build up the enhanced multi-modality ontology and compare the retrieval results. Results show that we can even classify close animal species which share similar appearances and we can infer their hidden relationships from the canine family graph. By assigning a ranking to the semantic relationships we show unequivocal evidence that our improved model achieves good accuracy and performs comparable result with the Google re-ranking result in our previous work.  相似文献   

18.
With the explosive growth of various social media applications, individuals and organizations are increasingly using their contents (e.g. reviews, forum discussions, blogs, micro-blogs, comments, and postings in social network sites) for decision-making. These contents are typical big data. Opinion mining or sentiment analysis focuses on how to extract emotional semantics from these big data to help users to get a better decision. That is not an easy task, because it faces many problems, such as different context may make the meaning of the same word change variously, at the same time multilingual environment restricts the full use of the analysis results. Ontology provides knowledge about specific domains that are understandable by both the computers and developers. Building ontology is mainly a useful first step in providing and formalizing the semantics of information representation. We proposed an ontology DEMLOnto based on six basic emotions to help users to share existed information. The ontology DEMLOnto would help in identifying the opinion features associated with the contextual environment, which may change along with applications. We built the ontology according to ontology engineering. It was developed on the platform Protégé by using OWL2.  相似文献   

19.
20.
相似度传播是本体映射中结构策略的实质内容。然而,目前的相似度传播算法却没有对相似度传播值进行合理的定量分析。针对此问题,提出了基于概念信息量的相似度传播算法,该算法根据已匹配节点的概念信息量大小来判断其子父节点匹配概率大小,通过匹配概率大小调整相似度传播值,从而进行更精确的相似度传播,提高结构策略的可信度。理论分析与实验结果证明了该算法是有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号