首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
WWW信息收集的ROBOT技术   总被引:13,自引:0,他引:13  
机器人(robot)是一种特殊类型的软件程序;是WWW搜索引擎收集Web文档索引信息的主要手段。在该文中,对robot技术进行了比较详细的分析和讨论,并对robot排除标准进行了扩展;使之可以更好地指导robot的信息收集工作。  相似文献   

2.
中英文WWW搜索引擎中数据获取的设计与实现   总被引:16,自引:0,他引:16  
Internet在我国的迅速发展和WWW上的信息量不断增长,迫切需要人们开发中英文兼容的WWW搜索引警。本文对中英文WWW搜索引擎中数据获取的总体设计思想,设计的实现技术作了较为具体的讨论和分析,并陈述了我们所做的工作。  相似文献   

3.
环球网图象搜索引擎研究综述   总被引:4,自引:0,他引:4       下载免费PDF全文
提出了建立一个WWW图象搜索引擎的方案,搜索引擎在Internet上浏览主页,对遇到的图象进行特征计算,抽取出索引信息,存储索引向量,根据图象内容进行相似图象的查找。分析了颜色直方图、边缘方向直方图、纹理分析和形状不变性等基于图象内容查询的技术,并对WWW图象搜索引擎的发展作出了预测。  相似文献   

4.
中英文WWW搜索引擎的信息处理   总被引:20,自引:0,他引:20  
描述了WWW搜索引擎信息的相关问题,尤其对中文WWW搜索引擎信息处理的关键技术进行了讨论,并在此基础上提出了一个中英文WWW搜索引擎的实现方案,理描述了其信息处理方法。  相似文献   

5.
随着互联网的迅猛发展,信息爆炸出现在人们面前,如何快速、方便、有效地从信息的海洋中找到需要的信息逐渐成为越来越重要的问题,搜索引擎也应需而生.按照搜索引擎的"全、准、快、好"评测标准,目前的许多搜索引擎已经不能满足人们的需求,存在很多问题.针对这一问题,设计了一个应用于中英文法律信息检索的搜索引擎系统.搜索引擎系统的设计涉及多种关键技术,而索引是搜索引擎的核心,搜索引擎后台工作的目的就是要建立关键词和文档的索引.建立高效、快速、优化的索引结构会对搜索引擎的性能产生决定性的影响.通过对索引系统功能模块的分析,引入了索引系统的设计问题.围绕索引系统关键词同步和文档同步,提出了一种适用于中英文法律信息检索的搜索引擎索引系统同步模块的设计方法与PHP程序实现,并通过实验数据分析其优劣.  相似文献   

6.
周利民  刘建国 《软件学报》1997,8(A00):504-510
本文介绍了一个中英文WWW搜索引擎-“天网”的系统结构和主要设计思想,与其它同类系统相比,“天网”在信息收集的控制,中文信息处理等方面具有很强的智能性、灵活性和适应性。  相似文献   

7.
WebLight-一个集文档管理的综合搜索引擎   总被引:3,自引:0,他引:3  
随着WWW网络信息的急剧膨胀,如何有效地获取成为一项关键技术。搜索引擎的出现,使Web得到初步的规整化,但是搜索引擎的低效率的查询速度,繁杂的语法规则,较低的信息覆盖率,没有改变互联网信息的无序性。为此,我们开发了WebLight综合搜索引擎,该系统提供了统一的查询语法界面,采取多线程机制从指定链接的多个搜索引擎中获取信息。  相似文献   

8.
温力 《计算机时代》2000,(10):32-33
当今,Internet技术得到持续、迅猛的发展,已经成为信息产业的热点技术。促进Internet 高速发展的因素之一就是WWW(World Wide Web)技术。通过 WWW,世界各地数以万计的用户不仅可以互相联系和获取各类信息,而且Web网页和数据库的连接,可以使各类系统平台上的用户方便的共享和利用现有的数据库资源。正因为如此,目前很多公司正在或准备构筑企业内部的Intranet,通过基于Web的数据库信息发布技术,在浏览器上向各类系统平台的用户提供一个访问界面一致,方便地在企业内部实现各种数据…  相似文献   

9.
如何构筑安全可靠的Web数据库应用系统   总被引:4,自引:0,他引:4  
Web技术和数据库技术的结合是WWW信息服务技术发展的大势所趋,由此产生了一系列的安全性问题,本文就如何构筑安全可靠的Web数字库应用系统,对从工作环境到程序应用的安全性问题进行了研究  相似文献   

10.
一种具有统一查询界面的Web搜索引擎   总被引:1,自引:0,他引:1  
1元搜索引擎背景 WWW目前已成为Internet上突破时间和空间的限制而获取信息的主要方式,人们通过搜索引擎来获取WWW资源日益普及。因为搜索引擎除能自动对WWW资源建立索引或进行主题分类以外,还能通过查询语法为用户返回匹配资源。 目前,Internet上有千余个搜索引擎,不同网站为满足用户的不同需求,都有自己的搜索引擎,人们熟悉的优秀搜索引擎有Yahoo!、Atavista、Lycos、Infoseek等。但事实说明,没有一个搜索引擎能够覆盖所有的WWW资源,这就很难满足用户查询信息时查全查准…  相似文献   

11.
一种WWW搜索引擎的设计与实现   总被引:2,自引:1,他引:2  
随着Internet在我国的迅速发展和WWW信息的不断增长,迫切需要开发中英文兼容的WWW搜索引擎来获得所需的信息。该文在分析WWW搜索引擎主要功能模块:信息采集模块、信息预处理模块和信息查询模块的基础上,提出采用人工智能搜索算法来遍历网页,对中英文网页进行自动的索引,并用向量空间的表示方法来表示网页内容和用户输入的查询表达式。实践证明,使用该搜索引擎,可以快速准确地搜索到用户所需的信息。  相似文献   

12.
WISE: a World Wide Web resource database system   总被引:4,自引:0,他引:4  
The paper describes the World Wide Web Index and Search Engine (WISE) for Internet resource discovery. The system is designed around a resource database containing meta information about WWW resources and is automatically built using an indexer robot, a special WWW client agent. The resource database allows users to search for resources based on keywords, and to learn about potentially relevant resources without having to directly access them. Such capabilities can significantly reduce the amount of time that a user needs to spend in order to find the information of his/her interest. We discuss WISE's main components: the resource database, the indexer robot, the search engine, and the user interface, and through the technical discussions, we highlight the research issues involved in the design, the implementation and the evaluation of such a system  相似文献   

13.
搜索引擎的Web Robot技术与优化   总被引:4,自引:0,他引:4  
崔泽永  常晓燕 《微机发展》2004,14(4):99-102
针对目前如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求,文中对搜索引擎作了概述,重点阐述了搜索引擎的Web Robot搜索器的搜索策略、文档提取以及搜索优化措施,提出了改进搜索引擎的Web Rohot的方法,改进后的Web Robot能够更有效地发现和搜集信息。为搜索引擎进行信息搜集,高效、稳定的Web Rohot保证了为用户提供的网上信息的全面性和实时性。  相似文献   

14.
文章将基于WWW的搜索引擎技术与基于数据库的图象检索技术有机结合起来,提出了一种基于视觉特征的图象搜索引擎方案,并实现了一个图象搜索引擎系统。该系统先用网络机器人在WWW上搜索图象,提取其颜色、纹理或形状特征,与提交的示例图象特征作比较,把图象的URL按与示例图象的相似度大小顺序存入数据库,然后从数据库中返回结果给用户,并在屏幕上显示。实验结果表明,该系统简单易行,能较好地满足用户的需求。  相似文献   

15.
网络信息的日益增加迫切需要适宜的检索工具,特别是进行专业信息的检索,需要体现专业词汇特点的搜索引擎。本文在对搜索引擎核心技术进行研究的基础上,提出了石油化工信息搜索引擎的设计方案,开发了网络机器人模块,实现了海量网页的自动获取;采用最短路径分词和正向最大匹配相结合的算法,实现了中文自动分词;开发了信息索引模块,实现了网页的批量索引和增量索引;开发了信息检索模块,提供布尔逻辑查询,实现摘要自动生成。通过系统集成,初步建立了体现石油化工专业特点的搜索引擎。  相似文献   

16.
文章通过对目前常用的web搜索技术进行分析,指出其缺陷。针对其缺陷,对提出来的的两项web信息搜索新技术:自适应性的、实时的搜索引擎和基于内容寻址的搜索进行了详细的分析与比较,指出它们解决问题的本质及带来的新问题。并就 WWW信息搜索技术的研究方向作了简要的讨论。  相似文献   

17.
Search engines are useful because they allow the user to find information of interest from the World Wide Web (WWW). However, most of the popular search engines today are textual; they do not allow the user to find images from the web. For effective retrieval, determining the semantics of the images is essential. In this paper, we describe the problems in determining the semantics of images on the WWW and the approach of AMORE, a WWW search engine that we have developed. AMORE's techniques can be extended to other media like audio and video. We explain how we assign keywords to the images based on HTML pages and the method to determine similar images based on the assigned text. We also discuss some statistics showing the effectiveness of our technique. Finally, we present the visual interface of AMORE with the help of several retrieval scenarios.  相似文献   

18.
基于Web数据挖掘的个性化搜索引擎研究综述   总被引:2,自引:0,他引:2  
Web数据挖掘是将教据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域.论述Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍个性化搜索引擎的一些情况,论述web教据挖掘在个性化搜索引擎中的应用.  相似文献   

19.
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域.本文论述了Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍了个性化搜索引擎的一些情况,最后论述了Web数据挖掘在个性化搜索引擎中的应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号