共查询到20条相似文献,搜索用时 109 毫秒
1.
基于本体的元搜索引擎结果排序算法研究 总被引:1,自引:1,他引:1
介绍了本体及元搜索引擎技术,认为将本体概念引入到元搜索引擎系统中,能够实现基于同义词、近义词的查询.给出了一个基于本体的元搜索引擎系统体系结构,介绍了系统的工作原理,提出了一种改进的摘要排序算法,并重点介绍了该算法的实现. 相似文献
2.
基于本体的元搜索引擎的设计与实现 总被引:1,自引:0,他引:1
与荚丈元搜索引擎相比,中文元搜索引擎还存在一定的差距,现有的中文元搜索引擎在实现关键词的扩展方面有待提高.通过对本体及元搜索引擎技术的研究,提出并实现了基于本体的元搜索引擎系统,介绍了系统的工作原理,通过对现有的元搜索引擎排序算法的分析,对摘要排序算法进行了改进.最终对系统进行测试并对其结果进行分析,该系统实现了对关键词的同义词和英丈扩展查询,有效地提高了系统的查全率和查准率. 相似文献
3.
4.
王梅文 《数字社区&智能家居》2007,2(8):441-443
分析了基于统计进行自动分类的元搜索引擎分类效果缺陷,提出了基于本体进行自动分类的元搜索引擎系统模型,阐述了主要步骤的实现思路,分析了本体在元搜索引擎自动分类中的作用。通过领域本体的语义理解,为用户提供查询概念的语义扩展,使元搜索引擎分类类目结构清晰、逻辑科学、系统,分类效果更加精确。 相似文献
5.
本文提出了一个基于多本体的搜索引擎框架,分析了本体、智能代理程序、搜索引擎本身在框架中的作用和工作模式.同时,针对互联网异构本体的查询问题,提出了一个分布式多本体查询的模型.引入本体技术后,web搜索引擎的工作方式由关键词全文检索转为知识检索,从而增强了搜索引擎处理复杂查询的能力. 相似文献
6.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,构建了基于本体的垂直搜索引擎模型。 相似文献
7.
8.
分析了当前网上搜索引擎的现状及存在的问题,提出了一种结合本体的垂直搜索引擎构建思想,并阐述了垂直搜索引擎构建的关键技术,最后设计实现了一个以电子杂志为主题的垂直搜索引擎原型. 相似文献
9.
本体采用基于语法词汇的表述方式,使本体自身表示可能存在模糊性、错误理解等问题,部分本体的概念可以通过自身的上下文信息推测出其含义,但是有些本体根据已有信息不能清晰表达其概念的确切含义.针对这个问题,提出基于背景知识的本体注释方法,对本体本身进行注释和澄清.包括基于WordNet和Web搜索引擎的注释方法,利用WordNet查找本体概念的正确词义,利用Web搜索引擎搜索本体概念的snippets,分别将词义和snippets作为其属性注释到本体中.实验表明本体注释率达到99.12%,表明本文方法的是可行的,本体注释正确率达到80.76%,比同类方法更高. 相似文献
10.
本文针对传统搜索引擎在搜索引擎的查全率和查准率方面的弱点,分析了站内搜索的重要性,提出了一种基于网站站内的机器人搜索引擎,并具体阐述了基于机器人综合式搜索引擎的网站站内搜索引擎的技术实现方式.该搜索引擎能够快速查找用户所需的信息,最大程度地满足用户需求. 相似文献
11.
针对垂直搜索引擎研究领域的关键技术问题,提出了一个结合本体筛选和文本挖掘的垂直搜索引擎构建思想.首先探讨了作为研究基础的本体和文本挖掘技术,讨论了两者的作用;之后阐述了垂直搜索引擎构建的关键技术,包括基于本体筛选的智能搜索器、结合文本挖掘的网页信息分析及抽取、索引器及查询处理器的构造;最后,对提出的思想进行了实现验证,构造一个面向高校毕业生招聘的垂直搜索引擎原型. 相似文献
12.
语义Web搜索技术研究进展 总被引:3,自引:3,他引:3
语义Web搜索技术是综合本体论、信息检索、自然语言处理等多学科理论和方法的新兴技术。介绍了语义Web和语义Web搜索的现状。在此基础上,给出了实现语义Web搜索技术的一般体系结构,并进一步分析了各组成模块的基本任务、现有技术和评价体系。最后给出了所做的相关工作和对语义Web搜索技术的展望。 相似文献
13.
在巨大的Internet/Web信息中很难积极地搜索到准确的信息,搜索引擎技术解决了用户检索Web信息困难的问题,而现有的搜索引擎返回的信息却并不总令用户满意。文中在对MAS理论调研的基础上,提出一个基于MAS的搜索引擎的模型,并将其与著名的Google搜索引擎作比较和分析。 相似文献
14.
Web社区是组织之间实现信息交流、共享和讨论的环境。一个Web社区一般涉及几十到几百个组织,怎样快速的从组成Web社区的组织中获取信息是一个很重要的问题。论文分析了Web社区搜索的特点,介绍了Web搜索引擎的基本原理。基于Web抓取器,向量空间模型,结合相关性排序等技术实现了一个Web社区搜索引擎——ChinalabSearch,详细阐述了系统的体系结构。根据对系统的性能评估,系统满足Web社区的搜索要求,可以提高在社区内查找信息的效率,为组织间的合作提供方便。 相似文献
15.
Nutch作为一个优秀的开源搜索引擎,其内核代码大量采用了MapReduce的编程模式,被越来越多的企业和团体用来定制符合自身需求的分布式搜索引擎产品.作为优秀的搜索引擎,其重要的前提是如何尽可能多地抓取到网页数据来建立索引.介绍了Nutch基于Hadoop下的分布式网络爬虫工作机制,指出其不足之处,并提出了改进方案,... 相似文献
16.
17.
18.
本文主要是关于搜索引擎与Web挖掘方面数据源的探讨。随着互联网的发展、信息量的巨增,搜索引擎显露出种种缺陷,产生了Web挖掘,之后引出工作性能低下等问题。于是,作者提出基于搜索引擎的Web挖掘和基于Web日志文件的数据仓库等解决方案,最后探讨了一个更为彻底的、有希望的元数据服务器的框架。 相似文献
19.
基于移动爬虫的专用Web信息收集系统的设计 总被引:3,自引:0,他引:3
搜索引擎已经成为网上导航的重要工具。为了能够提供强大的搜索能力,搜索引擎对网上可访问文档维持着详尽的索引。创建和维护索引的任务由网络爬虫完成,网络爬虫代表搜索引擎递归地遍历和下载Web页面。Web页面在下载之后,被搜索引擎分析、建索引,然后提供检索服务。文章介绍了一种更加有效的建立Web索引的方法,该方法是基于移动爬虫(MobileCrawler)的。在此提出的爬虫首先被传送到数据所在的站点,在那里任何不需要的数据在传回搜索引擎之前在当地被过滤。这个方法尤其适用于实施所谓的“智能”爬行算法,这些算法根据已访问过的Web页面的内容来决定一条有效的爬行路径。移动爬虫是移动计算和专业搜索引擎两大技术趋势的结合,能够从技术上很好地解决现在通用搜索引擎所面临的问题。 相似文献
20.
搜索引擎的Web Robot技术与优化 总被引:4,自引:0,他引:4
针对目前如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求,文中对搜索引擎作了概述,重点阐述了搜索引擎的Web Robot搜索器的搜索策略、文档提取以及搜索优化措施,提出了改进搜索引擎的Web Rohot的方法,改进后的Web Robot能够更有效地发现和搜集信息。为搜索引擎进行信息搜集,高效、稳定的Web Rohot保证了为用户提供的网上信息的全面性和实时性。 相似文献