共查询到20条相似文献,搜索用时 15 毫秒
1.
网上信息搜索技术与搜索引擎 总被引:6,自引:1,他引:6
随着Internet在全球范围内的迅速兴起,面对纷繁复杂的Web空间,如何在浩翰如海的信息空间里快速找到并取得所需的信息,便成为人们所关注的主要问题。搜索引擎的出现,极大地方便了Internet用户,使快速有效地获取信息成为可能。目前网上搜索引擎各种各样,有Yahoo!、Excite、AltaVista、Lycos、Infoseek、OpenText、WebCrawler、WWW Worm等几十种。 相似文献
2.
针对目前如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求,文中对搜索引擎作了概述,重点阐述了搜索引擎的Web Robot搜索器的搜索策略、文档提取以及搜索优化措施,提出了改进搜索引擎的Web Robot的方法,改进后的Web Robot能够更有效地发现和搜集信息.为搜索引擎进行信息搜集,高效、稳定的Web Robot保证了为用户提供的网上信息的全面性和实时性. 相似文献
3.
搜索引擎的Web Robot技术与优化 总被引:4,自引:0,他引:4
针对目前如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求,文中对搜索引擎作了概述,重点阐述了搜索引擎的Web Robot搜索器的搜索策略、文档提取以及搜索优化措施,提出了改进搜索引擎的Web Rohot的方法,改进后的Web Robot能够更有效地发现和搜集信息。为搜索引擎进行信息搜集,高效、稳定的Web Rohot保证了为用户提供的网上信息的全面性和实时性。 相似文献
4.
Web搜索引擎是Internet上非常有用的信息检索工具.但是,目前搜索引擎检索出的信息量庞大.如何能够快速和精确地在这种海洋信息中检索到用户所需信息已成为重要的研究课题.提出基于元搜索引擎理论上的专业课程信息搜索系统,着重研究结果页面信息的提取技术和向量空间模型算法. 相似文献
5.
6.
一种WWW搜索引擎的设计与实现 总被引:2,自引:1,他引:2
随着Internet在我国的迅速发展和WWW信息的不断增长,迫切需要开发中英文兼容的WWW搜索引擎来获得所需的信息。该文在分析WWW搜索引擎主要功能模块:信息采集模块、信息预处理模块和信息查询模块的基础上,提出采用人工智能搜索算法来遍历网页,对中英文网页进行自动的索引,并用向量空间的表示方法来表示网页内容和用户输入的查询表达式。实践证明,使用该搜索引擎,可以快速准确地搜索到用户所需的信息。 相似文献
7.
随着Internet的迅猛发展,Web成为了人们获取信息的重要途径。但是,网页数量的与日剧增,信息量的爆炸式增长,也为人们的信息查询带来了不便。Web数据挖掘技术的引入提高了检索质量,特别是Web结构挖掘在搜索引擎中的应用,很好地帮助用户快速从搜索结果中锁定对自己真正有用的信息。本文对基于结构挖掘的排序算法进行了大量搜集分析,并进行了归纳总结。 相似文献
8.
MD5算法在消除重复网页算法中的应用 总被引:1,自引:0,他引:1
Internet用户通过常用搜索引擎获取Web信息时,往往得到了大量的重复网页信息,从而导致搜索效率不高。本文利用MD5算法成熟及可移植性好的特点,提出了一种基于MD5的消除重复网页的算法,实验证明该算法能有效的去除重复网页,时间和空间的复杂度不高,具有较强的实用价值。 相似文献
9.
Internet用户通过常用搜索引擎获取Web信息时,往往得到了大量的重复网页信息,从而导致搜索效率不高.本文利用MD5算法成熟及可移植性好的特点,提出了一种基于MD5的消除重复网页的算法,实验证明该算法能有效的去除重复网页,时间和空间的复杂度不高,具有较强的实用价值. 相似文献
10.
11.
搜索引擎输入方式的研究 总被引:1,自引:0,他引:1
1 引言随着Internet的飞速发展,网络上信息量呈几何级数增长,截至2001年以前,网上约有数十亿网页。因特网上的信息是极其无序的,因此,信息量越大,越难被利用。如何获取和利用因特网上的信息就成了一个重要问题。目前解决这一问题的最佳途径便是利用搜索引擎。 2001年,Roper Starch的调查指出,36%的互联网用户一个星期花了超过2个小时时间在网上搜索;71%的用户在使用搜索引擎的时候遇到过麻烦;86%的互联网用户感到应当出现更有效的、准确的信息搜索技术。 相似文献
12.
在巨大的Internet/Web信息中很难积极地搜索到准确的信息,搜索引擎技术解决了用户检索Web信息困难的问题,而现有的搜索引擎返回的信息却并不总令用户满意。文中在对MAS理论调研的基础上,提出一个基于MAS的搜索引擎的模型,并将其与著名的Google搜索引擎作比较和分析。 相似文献
13.
Web搜索引擎是Internet上非常有用的信息检索工具,但是由于现有这些搜索引擎搜索出的结果只跟用户的搜索词条和它所采集的实际信息有关,用户对搜索结果的选择不能影响将来的搜索结果,这使得搜索引擎不能考虑大多数用户的兴趣状况.本文通过采集用户对搜索结果的访问序列来生成搜索引擎的反馈信号,以此来扩展原始查询串和影响搜索结果的生成,使得搜索引擎具有自适应能力. 相似文献
14.
Internet是人类有史以来最大量信息的集合地,因此,在Internet上找到自已想要的信息,就成为今天人们面临的最大问题,目前搜寻信息面临的问题主要有: ·如何使Internet上的搜索尽可能地彻底·搜索结果如何尽可能地完备但,搜索质量的好坏只能由用户自已来判断,如果用户满意搜索结果,则说它的质量好,反之,则差,这就要求搜索引擎的设计者需要了解用户的想法。如同数据库的检索一样,INTERNET上的搜索应尽可能地彻底,但在INTERNET上实现彻底却并不现实,没有人能承诺搜遍整个INTERNET(往往也没这个必要),我们需要做的只是尽可能大范围地搜索INTERNET,因此,作为INTERNET用户的一个重要工具,搜索引擎的作用不容小视,本文将对此进行探讨。 相似文献
15.
元搜索引擎什么是元搜索引擎?元搜索引擎(Metasearch Engine)是一种引擎,它将用户的请求发送到若干个其他独立的搜索引擎,并从每一个搜索引擎返回结果。这种搜索引擎方便用户仅输入一次查询条件就能同时访问几个搜索引擎。由于任何一个搜索引擎都不能对整个Web网进行编目,其思想是通过搜索多个搜索引擎,仅单击一次就能用较少的时间搜索更大范围的网络空间。使用方便和发现所需网页概率高的特点使得元搜索引擎受到那些希望搜索引擎能剔除不相干的“匹配”结果的人的欢迎。元搜索引擎是如何工作的?元搜索引擎并不拥有网页数据库,即不对Web进… 相似文献
16.
一个基于MAS的搜索引擎模型 总被引:1,自引:0,他引:1
在巨大的Internet/Web信息中很难积极地搜索到准确的信息,搜索引擎技术解决了用户检索Web信息困难的问题,而现有的搜索引擎返回的信息却并不总令用户满意。文中在对MAS理论调研的基础上,提出一个基于MAS的搜索引擎的模型。并将其与著名的Google搜索引擎作比较和分析。 相似文献
17.
18.
针对用户利用常用搜索引擎查询信息时,搜索引擎返回海量杂乱、无序的网页,用户难以从中快速、准确地获得真正关心的信息的现状,从Internet用户的兴趣度出发,设计了一种基于近似网页聚类算法的智能搜索系统。该系统在用户利用常用搜索引擎系统进行信息检索时,消除搜索引擎返回的重复页,对剩余页面进行聚类,返回给用户聚类后的网页簇,这样用户就可以选择浏览自己感兴趣的页面,从而大大提高了信息检索的查准率;实验证明该系统在保证查全率和查准率的基础上大大提高了搜索效率。 相似文献
19.
随着网络的高速发展,如何在海量信息中找到用户需求的高质量信息变得非常重要,技术难度较大.网页在搜索结果中排名是否靠前与巨大的商业利润相关联,这使得大量的垃圾网页出现在网络中.过滤Spam页面、给用户提供高质量的搜索结果成为当前Web搜索引擎的面临的一个巨大挑战.大量研究工作显示Spam页面之间存在着勾结的现象,分析Spam页面链接结构特性成为过滤Spam页面的重要方法.根据Spam网页链接结构存在的共性,提出了一种基于链接分析的Web Spam过滤方法.在标准检测数据集上进行实验,并与相关工作进行比较.实验结果表明,提出的方法能有效地对Spam网页进行过滤,提高搜索结果的质量. 相似文献
20.
互联网怎么用?网上的资料去哪里找?初上网者都很迷惑,其实用一个搜索引擎就能轻松找到你要的一切资料。下面,就让我们一步一步学习搜索的原理和技巧。●搜索引擎分类搜索引擎按其工作方式主要可分为两种:1.全文搜索引擎:最具代表性的有Google和百度。它们从互联网上提取各个网站的信息(以网页文字为主)来建立搜索数据库,然后从数据库里检索与用户查询条件匹配的相关记录,并按一定的排列顺序将结果返回给用户。2.目录索引类搜索引擎:这种引擎是按目录分类的网站链接列表。最具代表性的有新浪、雅虎、搜狐、网易等,各网站的具体网址如下:Goog… 相似文献