首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 195 毫秒
1.
文章提出了一种基于本体论的Web信息检索模型,它利用领域本体知识库对用户的查询要求进行语义扩展,并且将检索到的文档在语义层模型中根据概念层的概念匹配提出了一种概念关联匹配算法.从而克服了目前的检索工具中仅仅提供基于关键字的检索,但忽视了关键字本身语义信息所造成的错检和漏检.  相似文献   

2.
传统搜索引擎是基于关键字的检索,然而文档的关键字未必和文档有关,而相关的文档也未必显式地包含此关键字。基于语义Web的搜索引擎利用本体技术,可以很好地对关键字进行语义描述。当收到用户提交的搜索请求时,先在已经建立好的本体库的基础上对该请求进行概念推理,然后将推理结果提交给传统的搜索引擎,最终将搜索结果返回给用户。相对于传统的搜索引擎,基于语义Web的搜索引擎有效地提高了搜索的查全率和查准率。  相似文献   

3.
基于本体的语义标引研究与实现   总被引:2,自引:0,他引:2  
标引是资源管理与检索的基础.传统的标引方式仅停留在关键字异同的逻辑层面,忽略了文档语义层面上的信息.以本体的知识组织体系为基础,以抽取文档的语义向量为目标,提出了基于本体的语义标引思想,为基于概念匹配的语义检索创造条件.为了更清晰的描述标引过程,建立了基于本体的语义标引模型,并对模型中各环节进行详细的功能定义.参照具体的实例本体进行实验和分析.  相似文献   

4.
针对传统的论文检索方法缺乏语义理解,检索结果相关度不高的缺点,采用基于语义网络的文档语义表达模型,提出一种基于领域本体的检索方法。首先结合学科分类体系构建领域本体,并对论文文档进行语义索引;然后根据本体知识和索引信息构建基于语义网络的文档语义表达模型;最后改进用户查询与语义网络的相关度算法,综合关键词和语义的方法实现结果排序。实验结果表明,该方法能有效地提高论文检索的准确率和召回率。  相似文献   

5.
基于关键词语义扩展的检索策略   总被引:3,自引:0,他引:3  
杜金洋  易禾  杨春 《计算机应用》2009,29(6):1575-1577
传统基于关键字匹配检索策略由于关键字的机械字符匹配和一词多义问题很容易造成漏检和错检。为此,从领域本体概念入手,结合关键字检索的特点,提出一种基于关键词语义扩展的检索策略。策略使用领域本体描述的语义结构扩展关键字匹配范围,避免完全机械的字符匹配造成的漏检,从而提高检索的查全率。在此基础上,利用领域本体中语义相关度过滤检索无关结果,以提高检索的查准率,并根据检索结果与本体语义相关度算法排序。  相似文献   

6.
基于个性化本体的图像语义标注和检索   总被引:1,自引:0,他引:1  
针对目前图像检索系统较难实现语义检索的问题,提出了一种新的以本体为核心的图像语义标注和检索模型。构建个性化本体描述图像语义,继而提取基于概念集的图像语义特征并利用本体中“Is-A”关系设计相似性度量方法最终实现语义扩展检索。其难点在于顶级本体向个性化本体进化,以及基于概念集和“Is-A”关系实现语义相似度量的方法。通过系统的初步实现与相关实验的验证,该模型的检索准确度可达88.6%,明显高于传统的基于关键字和基于通用本体的图像检索,实现了图像智能检索功能。  相似文献   

7.
工程数据大量存在于现代生产制造企业。传统工程数据上沿用的关键字查询方法具有难以处理各种异构文档、无法识别关键字在工程领域的语义等缺陷。针对此,提出一种新的工程数据关键字检索方法。该方法先通过建立代表工程数据的本体,对各种异构的工程文档用适合的工具提取文本信息,建立XML快照。XML快照为索引关键字标注了相对应的本体概念。检索框架首先将用户的查询关键字匹配到本体的概念上,在匹配的过程中,提出一种算法消减关键字的语义混淆。在此基础上,提出一种排序模型,该模型对符合查询的XML快照进行打分排序,打分着重考虑了快照在语义上满足关键字查询的程度。检索框架最后排序并返回快照对应的原始文档给用户,使异构的工程数据文档能被统一处理和查询。该方法在工程数据上的检索结果查全率、查准率高,检索结果排序合理,能适用于实际企业中的大量工程数据文档,解决了传统工程数据检索的不足。实验使用了实际数据集,验证说明了该方法的实际有效性和性能上的高效性。  相似文献   

8.
基于文档平滑和查询扩展的文档敏感信息检测方法   总被引:1,自引:0,他引:1  
由于办公终端可能出现敏感信息泄露的风险,对终端上的文档进行敏感信息检测就显得十分重要,但现有敏感信息检测方法中存在上下文信息无关的索引导致文档建模不准确、查询语义扩展不充分的问题。为此,首先提出基于上下文的文档索引平滑算法,构建尽可能保留文档信息的索引;然后改进查询语义扩展算法,结合领域本体中概念敏感度适当扩大敏感信息检测范围;最后将文档平滑和查询扩展融合于语言模型,在其基础上提出了文档敏感信息检测方法。将采用不同索引机制、查询关键字扩展算法及检测模型的四种方法进行比较,所提出的算法在文档敏感信息检测中的查全率、准确率和F值分别为0.798,0.786和0.792,各项性能指标均明显优于对比算法。结果表明该算法是一种能更有效检测敏感信息的方法。  相似文献   

9.
Web信息检索技术已经在全世界广泛应用,然而,搜索引擎的查全率和查准率却不能够令用户满意,因此提出了一种基于通用本体WordNet的语义层次结构.通过计算和分析查询关键字与本体库的映射达到查询优化的目的.该方法通过建立一个简单的语法树并且索引WordNet,对查询关键字词法特性和本体实例之间语义关联强弱进行扩展和分析,提高了查询关键字到本体概念映射的完整性和准确率,进而帮助搜索引擎对用户的意图作出有效推测.实验表明,该方法可以有效地优化查询.  相似文献   

10.
以电子商务领域本体为基础,旨在提出一种改进的基于概念语义相似度计算模型,该模型结合基于距离和基于内容两个方面,能够更为全面精确地量化本体中概念结点之间的语义相似度。据此,进行查询关键词集概念扩展和查询与结果文档的相似度计算,最终形成检索算法。实验对比于Lucene检索算法,通过选取热点概念关键词从准确率、召回率、响应速度3个指标来评估检索算法的性能。实验证明,提出的检索算法与基于Lucene的信息检索方法相比,检索性能有较大提高。  相似文献   

11.
基于领域本体的语义标注方法研究   总被引:3,自引:0,他引:3  
介绍了语义Web.本体以及语义标注的基本概念,对语义标注方法以及现有技术工具进行了简单地说明和分析,提出了一种基于领域本体的语义标注方法,并结合石油产品领域的本体对该方法进行了实例说明.该方法通过分析文档的特征词汇,使用基于领域本体的空间向量模型方法建立词汇与本体概念之间的映射.采用这种方法对文档进行语义标注后,可以把文档隐含的语义信息显式的表现出来,这样数据库内部文档之间就具有了语义关联关系,为检索的智能推理提供基础.  相似文献   

12.
在服务网格中,分布式网络计算的实现依赖于如何在OGSA下实现服务交互问题的有效解决.为此,服务接口必须采用机器可理解的方式描述,从而为网格服务的动态发现和组合提供底层支持.服务语义标注技术满足了上述需求,它提出使用共享域本体中机器可理解的元数据标注服务资源描述.提出了一种有效的服务资源自动语义标注方法,该方法将服务语义标注过程分解为域标注和概念标注两个阶段,重点针对域标注问题,提出了基于机器学习的域标注算法,对实际服务资源的标注实验验证了该算法的有效性.  相似文献   

13.
为了解决水利领域中元数据搜索引擎缺乏语义理解,并且在集中式环境下索引水利元数据效率低下的问题,本文提出一种基于Hadoop的水利元数据语义搜索方法。首先结合本体与查询扩展技术的语义搜索方法,设计水利领域的本体推理规则、语义相似度计算方法、扩展词选择方法和语义相关度排序方法,从而有效地提高搜索结果的查全率与查准率;其次,针对XML形式的水利元数据建立索引的效率低下问题,引入Hadoop平台中的MapReduce并行处理模型,并行化处理解析提取元数据信息与索引建立工作,并修改SequenceFile的文件结构,以应对水利元数据的小文件问题,解决集中式环境下对水利元数据建立索引的性能瓶颈;最后利用Hadoop强大的并行计算能力,设计分布式环境下的语义扩展查询方法,从而提高水利元数据的查询效率。  相似文献   

14.
本体采用基于语法词汇的表述方式,使本体自身表示可能存在模糊性、错误理解等问题,部分本体的概念可以通过自身的上下文信息推测出其含义,但是有些本体根据已有信息不能清晰表达其概念的确切含义.针对这个问题,提出基于背景知识的本体注释方法,对本体本身进行注释和澄清.包括基于WordNet和Web搜索引擎的注释方法,利用WordNet查找本体概念的正确词义,利用Web搜索引擎搜索本体概念的snippets,分别将词义和snippets作为其属性注释到本体中.实验表明本体注释率达到99.12%,表明本文方法的是可行的,本体注释正确率达到80.76%,比同类方法更高.  相似文献   

15.
基于本体的语义检索技术   总被引:1,自引:0,他引:1  
基于本体的语义检索是建立在语义Web的基础上的检索技术。与传统的检索技术相比,它能提高检索的精度,减少了不相关的返回结果。使用句子成分进行实体的实例的初步创建,然后通过已经构造好的领域本体把实例和实体进行映射,从而构建领域本体的实例,通过对实例进行索引,达到概念级检索的目的。首先介绍了语义Web和本体的基本概念。然后详细讨论了基于本体的语义检索的实现的具体步骤及方法。最后分析了该方法的不足。  相似文献   

16.
用语义联想支撑基于内容的视频检索   总被引:10,自引:0,他引:10  
视频检索的传统方法之一是首先从视频中摘取出文本信息(如标题,关键词等等),然后基于一关键字集上回答用户的查询,由于自动摘取文本信息的过程至今尚未自动化,因而从视频中摘取信息主要由人工来完成,这在实际应用上证明是不现实的,另一种方法则是上一情形的极端,即它是利用低层的视频内容,诸如颜色,纹理,形状,运动特征等等,目的在于克服人工摘取关键字所涉及的困难,文中提出了基于ToC视频结构的语义表达,从视频的  相似文献   

17.
传统的视频检索大多采用基于关键词的方法,难以获得让用户满意的查准率和查全率。为此提出一种基于本体的视频检索技术,该技术借助于领域本体,以其基本概念为关键词通过互联网图像搜索引擎在线获取样本图像组,提取SIFT特征建立图像特征词典,抽取图像特征直方图并计算相似度,辅助完成视频的自动标注,初始化视频检索库;同时,借助于领域本体,对从用户的查询输入中抽取的关键词进行语义扩展,将以扩展概念集进行检索的结果返回给用户,以此实现基于本体的视频检索。最后,结合实例对该算法进行实现和分析,表明了该方法的可行性和有效性。  相似文献   

18.
基于Ontology的个性化推送系统   总被引:6,自引:0,他引:6  
信息自动推送技术是在网络信息激增的背景下发展起来的。在传统信息推送系统中,用户模板是用加权关键词来表示的,由于没有考虑词之间的潜在关系,造成了系统推送质量的下降,文章设计并实现了一个基于Ontology的个性化推送系统CarInfo,把零散的关键词组织成一个网状结构,提供了一个用户特征的抽象视图,并且半自动的实现了本体的构建,通过实验验证了系统的可行性。  相似文献   

19.
基于加权的本体相似度计算方法   总被引:1,自引:0,他引:1  
为优化基于本体的语义推理效果,提出了对本体中概念结点赋予权重的相似度计算方法.通过定义本体树中深度因子和密度因子,以解决本体中概念深度与密度对相似度计算的影响.利用Jena API、Lucene等开源工具包,提出了查询扩展方法.实验结果表明,提出的基于加权语义相似度计算模型与传统的计算法方法以及主观判断的方法相比,提高了相似度计算的准确性,效率有明显提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号