首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于本体的元搜索引擎结果排序算法研究   总被引:1,自引:1,他引:1  
介绍了本体及元搜索引擎技术,认为将本体概念引入到元搜索引擎系统中,能够实现基于同义词、近义词的查询.给出了一个基于本体的元搜索引擎系统体系结构,介绍了系统的工作原理,提出了一种改进的摘要排序算法,并重点介绍了该算法的实现.  相似文献   

2.
基于本体的元搜索引擎的设计与实现   总被引:1,自引:0,他引:1  
与荚丈元搜索引擎相比,中文元搜索引擎还存在一定的差距,现有的中文元搜索引擎在实现关键词的扩展方面有待提高.通过对本体及元搜索引擎技术的研究,提出并实现了基于本体的元搜索引擎系统,介绍了系统的工作原理,通过对现有的元搜索引擎排序算法的分析,对摘要排序算法进行了改进.最终对系统进行测试并对其结果进行分析,该系统实现了对关键词的同义词和英丈扩展查询,有效地提高了系统的查全率和查准率.  相似文献   

3.
基于本体的元搜索引擎技术研究   总被引:1,自引:0,他引:1  
针对现有搜索引擎的查询结果相关性低和缺少语义理解能力等问题,建立了一种基于本体的元搜索引擎模型。主要应用基于本体的用户个性模型和本体语义分析关联方法来提高元搜索引擎的查询效率。目的通过领域本体的语义理解应用,为用户提供查询意图个性化的有效推测和关键词本体的查询优化。  相似文献   

4.
分析了基于统计进行自动分类的元搜索引擎分类效果缺陷,提出了基于本体进行自动分类的元搜索引擎系统模型,阐述了主要步骤的实现思路,分析了本体在元搜索引擎自动分类中的作用。通过领域本体的语义理解,为用户提供查询概念的语义扩展,使元搜索引擎分类类目结构清晰、逻辑科学、系统,分类效果更加精确。  相似文献   

5.
本文提出了一个基于多本体的搜索引擎框架,分析了本体、智能代理程序、搜索引擎本身在框架中的作用和工作模式.同时,针对互联网异构本体的查询问题,提出了一个分布式多本体查询的模型.引入本体技术后,web搜索引擎的工作方式由关键词全文检索转为知识检索,从而增强了搜索引擎处理复杂查询的能力.  相似文献   

6.
张敏 《软件导刊》2010,(2):13-15
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,构建了基于本体的垂直搜索引擎模型。  相似文献   

7.
段磊  李琦  毛曦 《计算机科学》2009,36(2):172-174
提出了一种智能空间搜索引擎的解决方案.通过分析传统搜索引擎在处理空间语义方面的缺陷,将本体和自然语言处理技术引入搜索引擎中,解决基于自然语言查询的空间检索问题.初步构造了基于本体的空间搜索引擎的结构框架,分析了本体在空间搜索引擎中的应用范畴,并构建了相应的本体库以及解析自然语言查询的模式库,提出了自然语言式空间查询的解析方案.最后通过建立空间搜索引擎原型系统证明了该方案的可行性.  相似文献   

8.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,并阐述了垂直搜索引擎构建的关键技术,最后设计实现了一个以电子杂志为主题的垂直搜索引擎原型.  相似文献   

9.
本体采用基于语法词汇的表述方式,使本体自身表示可能存在模糊性、错误理解等问题,部分本体的概念可以通过自身的上下文信息推测出其含义,但是有些本体根据已有信息不能清晰表达其概念的确切含义.针对这个问题,提出基于背景知识的本体注释方法,对本体本身进行注释和澄清.包括基于WordNet和Web搜索引擎的注释方法,利用WordNet查找本体概念的正确词义,利用Web搜索引擎搜索本体概念的snippets,分别将词义和snippets作为其属性注释到本体中.实验表明本体注释率达到99.12%,表明本文方法的是可行的,本体注释正确率达到80.76%,比同类方法更高.  相似文献   

10.
本文针对传统搜索引擎在搜索引擎的查全率和查准率方面的弱点,分析了站内搜索的重要性,提出了一种基于网站站内的机器人搜索引擎,并具体阐述了基于机器人综合式搜索引擎的网站站内搜索引擎的技术实现方式.该搜索引擎能够快速查找用户所需的信息,最大程度地满足用户需求.  相似文献   

11.
针对垂直搜索引擎研究领域的关键技术问题,提出了一个结合本体筛选和文本挖掘的垂直搜索引擎构建思想.首先探讨了作为研究基础的本体和文本挖掘技术,讨论了两者的作用;之后阐述了垂直搜索引擎构建的关键技术,包括基于本体筛选的智能搜索器、结合文本挖掘的网页信息分析及抽取、索引器及查询处理器的构造;最后,对提出的思想进行了实现验证,构造一个面向高校毕业生招聘的垂直搜索引擎原型.  相似文献   

12.
语义Web搜索技术研究进展   总被引:3,自引:3,他引:3  
语义Web搜索技术是综合本体论、信息检索、自然语言处理等多学科理论和方法的新兴技术。介绍了语义Web和语义Web搜索的现状。在此基础上,给出了实现语义Web搜索技术的一般体系结构,并进一步分析了各组成模块的基本任务、现有技术和评价体系。最后给出了所做的相关工作和对语义Web搜索技术的展望。  相似文献   

13.
杨烁颖  白万民 《微机发展》2006,16(12):195-198
在巨大的Internet/Web信息中很难积极地搜索到准确的信息,搜索引擎技术解决了用户检索Web信息困难的问题,而现有的搜索引擎返回的信息却并不总令用户满意。文中在对MAS理论调研的基础上,提出一个基于MAS的搜索引擎的模型,并将其与著名的Google搜索引擎作比较和分析。  相似文献   

14.
Web社区是组织之间实现信息交流、共享和讨论的环境。一个Web社区一般涉及几十到几百个组织,怎样快速的从组成Web社区的组织中获取信息是一个很重要的问题。论文分析了Web社区搜索的特点,介绍了Web搜索引擎的基本原理。基于Web抓取器,向量空间模型,结合相关性排序等技术实现了一个Web社区搜索引擎——ChinalabSearch,详细阐述了系统的体系结构。根据对系统的性能评估,系统满足Web社区的搜索要求,可以提高在社区内查找信息的效率,为组织间的合作提供方便。  相似文献   

15.
Nutch作为一个优秀的开源搜索引擎,其内核代码大量采用了MapReduce的编程模式,被越来越多的企业和团体用来定制符合自身需求的分布式搜索引擎产品.作为优秀的搜索引擎,其重要的前提是如何尽可能多地抓取到网页数据来建立索引.介绍了Nutch基于Hadoop下的分布式网络爬虫工作机制,指出其不足之处,并提出了改进方案,...  相似文献   

16.
Web资源的多粒度语义标注及其应用技术研究   总被引:1,自引:0,他引:1  
当前的Web搜索引擎获得的搜索结果都是基于关键字标注的Web文档、页面或链接,不支持对文档内部信息的检索。为支持Wcb资源内部信息的检索,研究多粒度语义标注,即按树根结点、分支结点、叶子结点及资源信息元为粒度单位对Web资源进行组织管理,并在此基础上探讨基于本体的搜索技术。初步的分析和实验表明,这样可以提高从形式多样的海量Web资源中获取所需信息的效率。  相似文献   

17.
搜索引擎结果聚类算法研究   总被引:6,自引:1,他引:5  
随着Web文档数量的剧增,搜索引擎也暴露了许多问题,用户不得不在搜索引擎返回的大量文档摘要列表中查找。而对搜索引擎结果聚类能使用户在更高的主题层次上来查看搜索引擎返回的结果。该文提出了搜索引擎结果聚类的几个重要指标并给出了一个新的基于PAT—tree的搜索引擎结果聚类算法。  相似文献   

18.
本文主要是关于搜索引擎与Web挖掘方面数据源的探讨。随着互联网的发展、信息量的巨增,搜索引擎显露出种种缺陷,产生了Web挖掘,之后引出工作性能低下等问题。于是,作者提出基于搜索引擎的Web挖掘和基于Web日志文件的数据仓库等解决方案,最后探讨了一个更为彻底的、有希望的元数据服务器的框架。  相似文献   

19.
基于移动爬虫的专用Web信息收集系统的设计   总被引:3,自引:0,他引:3  
搜索引擎已经成为网上导航的重要工具。为了能够提供强大的搜索能力,搜索引擎对网上可访问文档维持着详尽的索引。创建和维护索引的任务由网络爬虫完成,网络爬虫代表搜索引擎递归地遍历和下载Web页面。Web页面在下载之后,被搜索引擎分析、建索引,然后提供检索服务。文章介绍了一种更加有效的建立Web索引的方法,该方法是基于移动爬虫(MobileCrawler)的。在此提出的爬虫首先被传送到数据所在的站点,在那里任何不需要的数据在传回搜索引擎之前在当地被过滤。这个方法尤其适用于实施所谓的“智能”爬行算法,这些算法根据已访问过的Web页面的内容来决定一条有效的爬行路径。移动爬虫是移动计算和专业搜索引擎两大技术趋势的结合,能够从技术上很好地解决现在通用搜索引擎所面临的问题。  相似文献   

20.
搜索引擎的Web Robot技术与优化   总被引:4,自引:0,他引:4  
崔泽永  常晓燕 《微机发展》2004,14(4):99-102
针对目前如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求,文中对搜索引擎作了概述,重点阐述了搜索引擎的Web Robot搜索器的搜索策略、文档提取以及搜索优化措施,提出了改进搜索引擎的Web Rohot的方法,改进后的Web Robot能够更有效地发现和搜集信息。为搜索引擎进行信息搜集,高效、稳定的Web Rohot保证了为用户提供的网上信息的全面性和实时性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号