共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
3.
手工构建本体是一项既费时又费力的工作,为解决此项工作的瓶颈问题,本体自动构建成为当前的一个研究热点和重点。考虑到不同语言描述的本体在本质上是相同的,只是表层的表示符号不同,提出了一种基于本体翻译的领域本体自动构建算法,该算法针对已存在本体中概念标签的不同情况,分别采用不同的统计指标来筛选标签的目标语翻译。通过将一个英文金融本体翻译成中文对算法进行了实验验证,说明了算法的有效性。 相似文献
4.
基于知识图的领域本体构建方法 总被引:1,自引:0,他引:1
提出了一种基于知识图的领域本体半自动构建方法。以《知网》为语义知识资源,知识图为语义表示方法,采用成熟的软件工程流程,最终构建出的领域本体具有结构明确、语义清晰的特点。对于在其上的语义网、信息抽取等应用提供了有效支持。介绍了本体的概念、设计的准则、建模的流程,并对未来的本体的移植性进行展望。实验结果表明该方法在不确定性知识处理上优于传统本体构建方法。 相似文献
5.
基于WordNet的本体澄清 总被引:3,自引:0,他引:3
由于本体能够消除概念的混淆和重用知识,因此它的质量对于语义网技术的应用非常重要.为了提高本体的质量,很多的工作集中在概念建模,但是本体表示这个非常重要的方面一直被忽视.目前本体的表示使用的是词(term),但同一个词可能有很多不同的意思,这样在基于本体的应用时将导致不清楚或错误的理解.为了解决这个问题,使用定义在WordNet中的词义(sense)而不是词来作为本体的表示,其原因是词义只有唯一的意思.本体澄清的定义为利用目标词周围的本体元素和被它标注的文档附近的词,对目标词进行自动消歧的过程.通过计算目标词义和它的邻居词的语义相似度,语义相关度最大的词义将选为正确的词义.实验表明,我们的算法有很好的性能.与最好的消歧算法相比,概念(Concept)精度差不多是名词精度的2倍,关系(Property)精度差不多是动词精度的3倍.实验证明了我们的算法在半自动的本体净化过程中也是非常有效的. 相似文献
6.
本体逐渐成为知识组织的热点研究领域.领域本体的构建作为本体研究的重要基石,还有很多关键技术值得探索.总结现有构建技术存在的问题,提出一种基于循环的领域本体的构建方法,核心思想是在循环中产生螺旋增量,使领域本体构建成为一个不断完善的迭代过程.通过构建渔业领域本体检验具有一定的实用性. 相似文献
7.
本体描述概念与概念间关系,旅游领域本体描述旅游领域内特定的概念定义和概念间的关系。本文基于海南省丰富的旅游资源基础上,使用最新的本体描述语言OWL2,依照斯坦福大学的七步法改进后构建旅游领域本体,并借助Hownet知识描述语言对本体的扩充和修改。 相似文献
8.
提出了一种重用现有领域知识库知识构造新领域本体的方法.该方法充分利用了领域知识模型以及领域本体相互之间存在的语义相关性,从语义匹配的角度探讨了构造新领域本体的可能性.首先给出了领域本体的一种结构化定义,然后讨论了领域模型之间、领域本体之间存在的语义相关性,并给出了领域本体语义相关度的概念.以此为基础,重点讨论了基于生物种群进化方法构造新领域本体的选择、克隆、变异、杂交、合成和转基因方法.最后详细介绍了一个虚拟领域本体构造系统,并给出了具体分析实例. 相似文献
9.
语义相似度的计算是自然语言处理中的重要研究内容,在过去几十年的研究工作中,已有大量的语义相似度计算方法被提出并广泛应用于语义消歧、文本聚类等领域中。基于WordNet本体,改进了信息量IC计算模型,进而提出了两种混合式的语义相似度的计算方法。实验结果表明,由于同时考虑了概念节点在WordNet中的最短路径距离和IC语义距离,所提方法优于已有方法,其计算结果更加接近人类的主观判断。 相似文献
10.
针对VSM不能揭示隐藏在不同特征词后面的相同概念语义、反映文档中的潜在语义关系、在相似度计算中精度较低的问题,提出一种基于领域本体的文档向量空间模型DOBVSM(domain ontology-based vector spacemodel)。该模型把领域本体中的概念扩展为文档特征词,并通过概念间的语义关系对特征词权重进行调整,最终建立包含语义关系的文档DOBVSM。通过实验分析表明:DOBVSM计算的文档相似度值更加发散,与专家评价值最为接近,能够较好地反映文档之间的相似情况。 相似文献
11.
针对本体映射精确度不高的问题,提出一种基于自然语言处理的本体映射结果校验方法。对复合词进行启发式处理,分析WordNet词库中词汇所对应注释的语法树,提取与参考本体和目标本体相关的词汇,对已有的本体映射结果进行校验。实验结果表明,该方法能有效提高本体映射的精确度。 相似文献
12.
13.
14.
一种基于自然语言信息隐藏的容量提高算法 总被引:1,自引:0,他引:1
给出了一个基于自然语言处理的文本信息隐藏的一般化模型,然后基于该模型讨论了增加信息隐藏容量的方法。接着给出了一个可以有效地增加信息隐藏容量的算法。从理论和实验上都表明,该算法可以有效地提高信息隐藏容量约25%以上。 相似文献
15.
16.
本体(Ontology)是共享概念模型的明确的形式化规范说明。本文首先介绍了斯坦福大学的半自动本体合并工具Prompt在本体概念匹配方面的缺点:忽略了概念的语义信息,无法识别同义词。对Thanh Dao提出的基于WordNet的概念语义相似度算法进行改进,并将其用于Prompt,弥补了其无法进行语义匹配的缺陷。 相似文献
17.
领域本体半自动化建模工具的设计与实现 总被引:1,自引:0,他引:1
现有的大多数本体都是通过手工构建的。然而,本体的构建是一项非常费时费力的过程,近年来如何半自动地构建领域本体的研究越来越多。文章提出了基于中文分词以及数据挖掘技术的半自动领域本体建模方法,该方法能大大提高本体构建的效率,并且一定程度上保证本体的质量。实验证明该方法是可行的。 相似文献
18.
文本分割在信息检索、摘要生成、问答系统、信息抽取等领域发挥着重要作用。在总结现有的国内外文本分割方法的基础上,提出了一种基于领域本体对文本进行线性分割的方法。该方法利用初始概念自动获取结构化语义概念集合,并根据获取的概念、属性及属性词在文本中出现的频次、位置和关系等因素为段落赋予语义标签,挖掘文本的子主题信息,将拥有相同语义标注信息的段落划分为相同语义段落,实现了文本不同子主题之间的分割。实验结果表明,该方法对于特定领域的文本分割的准确率、召回率以及F值分别达到了85%,90%和88%,分割效果能够满足实际应用需求,并优于现有的无需训练语料的文本分割方法。 相似文献
19.
Web信息检索技术已经在全世界广泛应用,然而,搜索引擎的查全率和查准率却不能够令用户满意,因此提出了一种基于通用本体WordNet的语义层次结构.通过计算和分析查询关键字与本体库的映射达到查询优化的目的.该方法通过建立一个简单的语法树并且索引WordNet,对查询关键字词法特性和本体实例之间语义关联强弱进行扩展和分析,提高了查询关键字到本体概念映射的完整性和准确率,进而帮助搜索引擎对用户的意图作出有效推测.实验表明,该方法可以有效地优化查询. 相似文献