共查询到18条相似文献,搜索用时 203 毫秒
1.
数据集成的难点是如何解决数据之间的语义异构问题,本文利用本体在语义集成上的优点,提出了一种基于本体语义映射的数据集成框架。根据本体概念的定义及其结构,给出了一种本体语义映射算法,该算法通过属性集合间的比较确定概念语义关系,在计算概念相似度时,考虑了概念名称、概念属性集合和相关概念的语义信息。最后通过概念的属性集映射算法和概念映射算法实现了本体语义映射,从而重点解决了数据集成中的语义映射问题。 相似文献
2.
《信息与电脑》2018,(2)
基于多领域本体信息检索的主要问题之一是如何将网页准确地划分到本体,即判断网页与本体的关系。笔者提出了基于Floyd算法的网页与多领域本体的匹配算法,主要思路是先利用Rough集理论对从网页中抽取的关键字进行属性约简,得到最小属性集合,再查找该集合所有元素的同近义词集合且匹配出两者的共同关键字,得到最终的关键字集合,并将其映射到本体无向图上,接着利用Floyd算法计算出共同关键字与多本体的最短路径及其加权值,最后通过相关度与初始阈值的大小关系判断网页与本体的归属情况。笔者通过与其他算法进行对比实验验证了本算法的可行性和合理性,且时间和空间复杂度相对较小。 相似文献
3.
本体映射中的概念相似度计算 总被引:1,自引:0,他引:1
本体是概念、属性和关系的集合,本体映射是解决本体异构的最好方法.文中针对目前本体映射过程中概念相似度计算存在的问题,提出一种综合的相似度计算方法.先根据本体中两个概念名称的相似性,选出最相关的概念,减少相似度的计算,然后分别基于概念的属性、实例和关系来计算概念相似度,并进行综合得到概念相似度.在计算属性相似度时,先通过计算属性的信息增益来确定各个属性的优先级,最后只选取几个信息增益大的属性进行相似度的计算,从而减小计算量. 相似文献
4.
相似本体间属性映射方法的研究 总被引:6,自引:0,他引:6
在以往的本体映射技术的研究中,大多数的研究都集中于本体中的概念间的映射,而很少有人从事概念间属性映射的研究工作。然而对于一些复杂的嘘用,仅仪是概念之间的映射是不充分的。例如通过指定属性的约束条件来检索实例,就需要发现属性间的映射关系。另一方面,目前的很多本体映射方法都存在准确率低,启发信息少的问题,而属性间的映射关系可以被应用在辅助概念映射上边。所以希望能够将属性映射同概念映射集成,以达到更好的映射效果。因此该文对相似本体间的属性关系进行了研究,并在此基础上提出一种基于本体的属性映射方法。 相似文献
5.
本体是概念、属性和关系的集合.本体映射是解决本体异构的最好方法。文中针对目前本体映射过程中概念相似度计算存在的问题,提出一种综合的相似度计算方法。先根据本体中两个概念名称的相似性,选出最相关的概念,减少相似度的计算,然后分别基于概念的属性、实例和关系来计算概念相似度,并进行综合得到概念相似度。在计算属性相似度时,先通过计算属性的信息增益来确定各个属性的优先级,最后只选取几个信息增益大的属性进行相似度的计算,从而减小计算量。 相似文献
6.
伴随语义网的发展,语义网本体数量激增.然而万维网上绝大多数的数据仍存储在关系数据库中.建立关系数据库模式与语义网本体间的映射是一种实现两者之间互操作性的有效途径.因此,提出了一种基于语义的关系数据库模式与OWL本体间的映射方法SMap,包含简单映射发现和复杂映射学习两个阶段.在简单映射发现阶段,首先通过逆向工程规则将关系数据库模式和本体中的元素对应地分为不同类别,再为每个元素构建虚拟文档并计算它们之间的相似度,其中针对不同类别的元素设计了不同的虚拟文档抽取方案.在复杂映射学习阶段,基于已发现的简单映射以及重叠的数据库记录和本体实例,自动化地生成训练事实数据,然后运用归纳逻辑编程算法学习出多种类型的基于Horn规则的复杂映射.真实数据集上的实验结果表明,SMap在简单映射发现和复杂映射学习上均明显优于现有的关系数据库模式与本体间映射方法. 相似文献
7.
8.
一种关系数据库模式到本体映射的失效检测方法 总被引:2,自引:0,他引:2
从关系数据库到本体的语义映射对于实现关系数据库和本体之间的互操作具有十分重要的作用。然而,关系数据库模式和本体的演化都会造成这些语义映射的失效,只有准确定位受影响的映射集合才能进行进一步的映射维护工作。提出了一种映射失效检测方法,首先通过对关系数据库模式(本体)的新旧版本进行比较来求取变化元素集合和合理演化路径,然后基于该变化元素集合生成查询测试集,并且借助相应的映射将查询测试集中的查询重写。最后,根据重写后的查询能否返回合法实例,就可以判定查询重写所使用的映射是否失效。 相似文献
9.
10.
为了解决Web服务发现中存在的本体异构问题,研究了基于本体概念及属性的简单本体映射。在已有本体映射方法的基础上,通过引入广义信息的概念,提出了一种针对关系映射的改进方法,将简单映射扩展成复杂映射,并使用广义信息中的广义熵概念优化了相似度计算的方法,剔除了其中不相关的计算。实验结果表明,该方法在不影响查全率和查准率的前提下大幅度地提高了时间效率。 相似文献
11.
从已有的数据模型中进行语义提取,经过一定的规则映射生成本体的过程称为本体学习。关系数据库模型是当前数据的存取与组织的主要模型,从中学习得到本体,一直是本体工程领域研究的热点之一。利用手工定义的E-R模型到本体的映射规则来完成本体的构建,是国内外大部分学者采用的方法。但这样获得的本体概念层次关系主观依赖性强,不利于本体的实际应用。为了能更加客观地获取数据之间的概念层次关系与语义信息,提出了一种基于FCA(形式概念分析)从关系数据库进行本体学习的方法。该方法既保持了关系数据表中原有的数据语义关系,又发挥了FCA自动提取语义信息的特点,提高了最终本体生成的质量,有利于在具体的领域应用中使用本体。最后结合材料服役安全数据库的数据信息,演示了运用所提出的方法学习得到领域本体的过程。 相似文献
12.
13.
基于同义词表的异构数据库-本体映射 总被引:1,自引:0,他引:1
本体是信息在语义层和知识层的描述。将现有的其它数据形式转换为本体表示将有利于实现数据共享和语义推理。目前计算机系统中的数据大多以关系数据库形式存在,因此基于关系数据库构建本体的研究具有重要意义。本文首先分析了单一数据库-本体映射问题,扩充了Ghawi规则以覆盖更多类型的数据关系,其次针对同质异构数据库-本体映射问题,进一步扩充Ghawi规则,给出了基于同义词表的异构数据库-本体映射规则集,实现了异构数据库-本体映射。 相似文献
14.
目前大多数的视频语义概念提取研究没有考虑到视频多模态之间的关联共生特性,而在样本的标注方面采用自定义的概念进行标注,会影响语义概念提取的准确率。针对上述问题,提出结合Simfusion算法和用本体知识库标注样本的方法提取视频的语义概念,该方法根据镜头内容变化提取关键帧,在提取出镜头内容时,有效地利用镜头多模态之间的时序关联共生特性,同时运用本体知识库中的概念标注样本、训练分类器,弥补传统方法在标注样本时存在的主观、不规范等不足。实验结果表明,该方法在视频语义概念提取的研究中,有较高的准确度、可操作性强。 相似文献
15.
在语义数据集成中本体映射是关键,手工设置映射关系不仅消耗时间而且不准确,需要使用本体映射工具自动发现这种映射关系.在现有本体映射方法的基础上提出了基于领域学习的映射发现策略,可以从领域知识中发现复杂映射的规则,增加映射时的实例数据,从而提高映射发现的查全率和准确率;同时利用本体中丰富的语义知识去筛选候选数据,从而降低映射方法的算法复杂度.实验证明该方法是有效的. 相似文献
16.
17.
18.
随着本体的增多,本体异构是本体间互操作的主要障碍,阻碍了本体信息共享,解决本体异构最好的方法是本体映射。本体映射的关键是概念相似度的计算,但现今的计算模型考虑的影响因素比较单一。结合距离语义相似度和属性语义相似度,提出了一种综合语义相似度计算方法。实验证明,该方法可以提高计算结果的精确度。 相似文献