首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
从已有的数据模型中进行语义提取,经过一定的规则映射生成本体的过程称为本体学习。关系数据库模型是当前数据的存取与组织的主要模型,从中学习得到本体,一直是本体工程领域研究的热点之一。利用手工定义的E-R模型到本体的映射规则来完成本体的构建,是国内外大部分学者采用的方法。但这样获得的本体概念层次关系主观依赖性强,不利于本体的实际应用。为了能更加客观地获取数据之间的概念层次关系与语义信息,提出了一种基于FCA(形式概念分析)从关系数据库进行本体学习的方法。该方法既保持了关系数据表中原有的数据语义关系,又发挥了FCA自动提取语义信息的特点,提高了最终本体生成的质量,有利于在具体的领域应用中使用本体。最后结合材料服役安全数据库的数据信息,演示了运用所提出的方法学习得到领域本体的过程。  相似文献   

2.
本体的自动抽取问题是电子政务信息集成的核心问题之一。在本体的自动抽取过程中,FCA方法用于自动分析概念之间的关系,但它对概念间的同义词关系分析不够。基于这个原因,对FCA方法进行了优化,提出了SFCA算法。算法根据属性在概念中的重要性对属性赋权值,利用属性的权值计算两个概念的相似度,最终确定两个概念是否是同义词关系。通过对算法的实验结果的分析验证其是有效的,并给出了正确性证明。  相似文献   

3.
一种基于未知结构网页抽取本体的方法   总被引:1,自引:1,他引:0  
强宇  胡运发 《计算机科学》2009,36(2):186-189
在Web上数据大多是结构化的,但事先并不熟知数据的结构,因此不能有效地查询感兴趣的数据.提出了一种独立于文本抽取本体的方法,其过程包括表的理解、数据集成和本体生成,其中表理解是搜寻定位兴趣表、识别及匹配属性和值,并形成记录;数据集成是匹配源记录和目标模式;本体卷积是将源记录的数据抽取到目标模式.结果表明这种方法可以通过已知的目标模式有效地抽取未知结构的数据.  相似文献   

4.
从关系数据库构建语义丰富本体的方法   总被引:1,自引:0,他引:1  
网络中大量数据存储在关系数据库中,利用这些数据资源构建领域本体是实现语义Web的任务之一。制定了一组优化的通用转换规则(特别注重对元组信息的语义分析与挖掘),结合领域专家的选择判断,在尽量保留和挖掘关系数据库语义信息的基础上,给出了一个从关系数据库半自动构建OWL本体的方法,同时利用WordNet对本体进行语义丰富,并最终通过系统实现转换过程。  相似文献   

5.
针对领域科学数据异构多样、缺乏语义的问题,本文提出一种基于本体的异构数据语义抽取方法。首先,构建领域科学数据的语义抽取框架,并在此基础上分别针对结构化、半结构化以及非结构化数据制定相应的语义转换与抽取规则,形成局部领域本体;然后,通过异构数据间的关联映射,构建领域数据的全局本体,实现异构数据的有效组织与统一管理;最后,将相关方法应用到材料领域,为材料科学数据的有效管理与共享服务提供支撑。  相似文献   

6.
多本体中子本体抽取的研究   总被引:1,自引:2,他引:1  
企业各部门中存在大量的知识源本体,在实际应用中,往往需要使用多个知识源本体的部分内容,即子本体。当前的子本体抽取方法大都是针对单一本体,分析了多本体中抽取子本体的主要问题,提出了一种可以从多本体中抽取所需子本体的有效方法。该方法降低了子本体抽取的复杂性。  相似文献   

7.
一种改进的基于本体的Web信息抽取   总被引:1,自引:0,他引:1       下载免费PDF全文
以Web页面信息项本体定义为基础,对单个样本页面信息项路径进行启发式学习,对所有样本页面集中信息块路径进行归纳学习,识别结构相似的信息块子树位置,以准确划定信息抽取区域,降低页面噪声。将经过噪声处理的样本页面自动解析成页面的结构本体。比较Web页面信息项本体和页面的结构本体,通过归纳学习算法生成抽取规则,提高Web信息的抽准率。  相似文献   

8.
一种从关系数据库向Flogic本体转换的方法   总被引:3,自引:0,他引:3  
目前提出的从关系数据库中获取本体的方法主要关注主键之间的相关性,导致抽取的语义信息不全。本文提出一种将关系数据库向Flogic表示的本体转换的方法,该方法通过对主键、数据、属性相关性的综合分析,可以抽取出关系数据库中隐含的语义信息,如继承关系及优化结构。  相似文献   

9.
一种关系数据库到本体的自动构建方法   总被引:1,自引:0,他引:1  
随着语义网的发展,对本体的需要也越来越大。但是目前大多数的数据被存储在关系数据库中,这些数据不能被语义网应用程序所访问。因此如何将关系数据中的数据转化为可以被语义网应用的数据,是一个需要解决的问题。针对上述问题,提出了一种从数据库自动地构建OWL本体的方法。该方法把本体构建过程分为语义信息的发现和本体映射两个部分。并且定义了一种图M-Graph,通过M-Graph的生成与分析,结合映射规则自动地构建OWL本体。实验验证,该方法可自动地由关系数据库构建OWL本体,并且可以得到相对丰富和准确的本体。  相似文献   

10.
为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架.对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案.实验结果表明,该方法可以得到性能较高的抽取结果.  相似文献   

11.
FCA与本体结合研究的综述   总被引:10,自引:2,他引:8  
本文对近年内形式概念分析(Formal Concept Analysis,FCA)与本体(Ontology)的结合研究进行综述,基于具体的应用来描述它们结合的方式。FCA和本体是两种形式化方法,FCA和本体的目标都是构建概念的模型,它们各有特点,本文从应用的角度讨论两种工具如何相互补充,描述了FCA怎样支持本体工程和本体如何改善FCA的应用。  相似文献   

12.
在现实世界中,有些对象比其它的更具有一般性,两个对象的相似度可能不对称。两个对象之间的相似关系可能既不对称又不传递,我们用弱相似关系来表示。本文提出了非对称冗余元组来处理模糊关系数据库中的弱相似关系。非对称冗余元组的概念是模糊关系数据库的冗余概念的推广,它用来删除一些冗余信息,表示更精确的信息。  相似文献   

13.
从算法的角度,阐述将FCA的核心——概念格,应用于以图像底层特征为外延、VAD心情空间中的情感分类为内涵所构成的模糊形式背景中,给出了基于图像情感本体的模糊概念格的基本概念,根据模糊形式背景构建并维护相应模糊概念格,提出了今后的研究方向,为同课题组的其他研究提供支持。  相似文献   

14.
WEB本体语言(OWL)是一种用于对本体进行语义描述的语言,不仅提供强大的语义表达能力,而且能够表达机器可以理解的内容。关系数据库在存储与管理大规模数据方面相应技术比较成熟。针对该情况,结合两者的优势,提出一种基于关系数据库存储 OWL 本体的存锗模式,主要针对本体类的存储模式的设计思想和关键接口实现技术进行叙述。案例研究表明,所设计的类可以有效的实现关系数据库和OWL本体类之间的数据转换。  相似文献   

15.
面向关系模式的领域本体获取   总被引:6,自引:0,他引:6       下载免费PDF全文
从遗留信息系统中获取领域信息是创建领域本体的重要环节,也是设计知识重用的有效方式。以常用的关系模式为研究对象,分析如何从遗留系统中识别关系模式的结构信息,在此基础上,提出了12条术语转换规则,根据转换规则从关系模式的结构信息中逆向提取领域术语及相互关系,为领域本体的创建奠定了基础。  相似文献   

16.
罗军  陈波 《计算机工程》2010,36(21):71-72,75
Web本体语言(OWL)是一种用于对本体进行语义描述语言,不仅提供强大的语义表达能力,而且能够表达机器可以理解的内容。关系数据库在存储与管理大规模数据方面相应技术比较成熟。针对该情况,结合两者的优势,提出一种关系数据库存储OWL本体的存储模式,在存储大规模数据和保持语义完整性两者之间取得一个平衡点,使关系数据库存储OWL本体既能存储海量数据,又能最大限度保持其语义完整性。  相似文献   

17.
从关系数据库到本体映射研究综述   总被引:2,自引:0,他引:2  
随着语义Web技术的逐步发展,本体在数据集成和异构系统语义交互研究中起到越来越重要的作用.本文对近年来从关系数据库到本体建立语义关联的研究现状进行了阐述,将其分为从关系数据库抽取本体以及关系数据库模式与给定本体进行映射两大类,分别针对这两类方案的特点、应用领域、相关研究和工具进行了详细分析,并对当前的典型研究成果进行比较.在此基础上指出映射维护、工具可视化、利用实例知识或领域知识辅助映射以及自动映射的评价是未来的研究和发展方向.  相似文献   

18.
在事件信息的抽取中,事件要素的提取是一个难点。现有的事件要素抽取主要是基于机器学习的方法,这类方法容易受到语料稀疏性的影响。该文提出一种基于事件本体的事件要素提取方法,该方法将事件要素推理分为两步: 一、通过事件要素词和事件指示词的位置关系来初步填充要素值,并将得出的置信度较高的事件作为种子事件;二、利用第一步得出的种子事件,查询事件本体中的事件类约束和基于事件非分类关系的推理规则,并对要素进行推理,进一步对事件要素进行填充和修正。实验结果表明,该方法能较好地提升事件要素提取的准确度。  相似文献   

19.
基于依存句法“动词配价”原理与组块的概念,提出以情感依存元组(EDT)作为中文情感表达的基本单位。它以句中能承载情感的几类实词作为中心词,修饰词依附于中心词,程度词和否定词依附于中心词和修饰词。该文对句子进行句法分析,在句法树和依赖关系中按规则提取情感依存元组,建立简单句情感依存元组判别模型计算情感倾向性。针对COAE2014评测公布的网络新闻语料,将该方法分别与有监督分类算法(KNN、SVM)和半监督算法(K-means)进行实验对比。结果表明,基于EDT的情感分类性能与有监督的机器学习算法相当,远高于半监督的聚类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号