共查询到16条相似文献,搜索用时 46 毫秒
1.
数据集成的难点是如何解决数据之间的语义异构问题,本文利用本体在语义集成上的优点,提出了一种基于本体语义映射的数据集成框架。根据本体概念的定义及其结构,给出了一种本体语义映射算法,该算法通过属性集合间的比较确定概念语义关系,在计算概念相似度时,考虑了概念名称、概念属性集合和相关概念的语义信息。最后通过概念的属性集映射算法和概念映射算法实现了本体语义映射,从而重点解决了数据集成中的语义映射问题。 相似文献
2.
3.
4.
Web信息检索技术已经在全世界广泛应用,然而,搜索引擎的查全率和查准率却不能够令用户满意,因此提出了一种基于通用本体WordNet的语义层次结构.通过计算和分析查询关键字与本体库的映射达到查询优化的目的.该方法通过建立一个简单的语法树并且索引WordNet,对查询关键字词法特性和本体实例之间语义关联强弱进行扩展和分析,提高了查询关键字到本体概念映射的完整性和准确率,进而帮助搜索引擎对用户的意图作出有效推测.实验表明,该方法可以有效地优化查询. 相似文献
5.
本体中概念相似度的计算 总被引:10,自引:0,他引:10
本体是概念、属性和关系的集合。本体异构是本体间互操作的主要障碍,解决本体异构最好的方法是本体映射。本体映射的关键是概念相似度的计算,但计算时一般不考虑关系和属性对相似度的影响,计算结果存在误差。论文从两个方面对概念的相似度进行计算。首先计算概念的语义相似度,然后计算概念描述相似度。实验表明该计算方式可以提高计算结果的精确度。 相似文献
6.
7.
基于关键词处理的传统检索技术会在检索过程中遗漏大量与检索概念相关或同义的内容。针对这种情况,提出了一种基于本体的Web信息检索模型。另外该模型通过解析语义文档并分析所需的概念属性之间的关系得到一定的相似度,并在检索过程中利用该相似度进行语义扩展。 相似文献
8.
9.
随着本体技术的逐渐成熟,如何为本体搭建语义桥梁以实现知识的重用与共享成为新的研究热点。在分析现有相关技术的基础上,提出通过解析本体中概念的特征并借助语义相似度度量技术找到不同本体间相同或相近的概念对的计算方法,同时用于本体映射过程中。实验证明,该方法具有良好的效果。 相似文献
10.
11.
一种使用双阈值的数据仓库环境下重复记录消除算法 总被引:3,自引:1,他引:2
重复记录消除是数据清理研究中一个很重要的方面,它的目的是检测并消除那些冗余的、可能对后来的OLAP和数据挖掘造成影响的数据。已有研究都是通过设定一个相似度阈值来判断两条记录是否为重复记录。过大的阈值将导致返回率下降,过小的阈值将导致误检率上升。文章提出了一种双阈值的重复记录消除方法,利用数据仓库环境下数据库表之间的外键联系做进一步判断,可以有效地提高判断质量,减小误检率。 相似文献
12.
13.
检索是获取信息的重要方式。传统检索只停留在关键字异同的逻辑层面,忽略了语义层面的信息。以本体的知识组织体系为基础,以检索应用为目标,提出面向本体的文档和查询的语义向量表示方法,进而建立面向本体的相似度计算方法,为语义检索创造条件,检索结果关注语义层面的匹配。并在理论的指导下,进行实验和分析。 相似文献
14.
语义Web的高速发展使其具有动态性和异构性特征,解决语义信息的异构性问题成为实现信息集成的关键。本体作为一种语义Web的知识表示形式,增强了Web的语义信息。因此,为了解决语义异构性,实现数据间的互操作,必须建立异构本体间的映射关系。然而,为庞大的异构本体建立完全精确的本体映射是不现实的,本体映射中存在一定的不确定性。提出了一种新型的本体映射框架——语义集成中的不确定性本体映射。从不同方面研究本体特征,集合了多种映射策略,并引入了各映射策略中不确定性匹配的解决方案。实验证明,该方法具有可靠的实验性能,并且具有很好的通用性和可扩展性。 相似文献
15.