首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
首先分析了搜索引擎的工作原理,其次简要设计了搜索引擎在网络信息挖掘中应用,并进一步研究了搜索引擎的应用实现,涉及到挖掘预处理、挖掘训练以及信息文件的操作。对搜索引擎的应用研究起到一定的借鉴作用。  相似文献   

2.
本文阐述了网络检索和联机检索的概念,采用对比的方法论述了基于Intenet的网络检索和传统的联机检索之间的异同.并分析了网络检索与联机检索各自的优缺点及两者今后的发展方向,以便更好地发挥两者的优势,取长补短,提高检索的整体效应。  相似文献   

3.
数据挖掘技术在网络业务流设计中的应用   总被引:3,自引:0,他引:3  
李伟  魏恒义 《计算机工程》2002,28(5):49-50,66
论述了数据挖掘技术在网络业务流设计中应用的必要性和可行性,探讨了在进行网络业务分析时运用数据挖掘技术的全过程,并指出该分析方法是以业务为分析单位的,运用该方法可以从业务角度对网络状况和网络行为进行分析。  相似文献   

4.
基于元搜索引擎的研究   总被引:1,自引:0,他引:1  
元搜索引擎通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制.介绍了元搜索引擎分类与实现技术,结合中外元搜索引擎的实例,对使用元搜索引擎存在的问题、选择和设计元搜索引擎及元搜索引擎的发展进行分析、探讨.  相似文献   

5.
网络信息挖掘能为管理决策起到至关重要的作用。该文在明确搜索引擎及信息挖掘意义的基础上,分析了搜索引擎的工作原理,并通过研究网络信息挖掘系统,探讨了搜索引擎在网络信息挖掘中的应用设计及实现。  相似文献   

6.
元搜索引擎及其实现   总被引:14,自引:0,他引:14  
单个搜索引擎的索引和处理能力的提高赶不上Web数据的快速增长,结果是任何单个搜索引擎只能索引Web的一部分文档,用户需要的文档分布在许多搜索引擎的文档数据库中,元搜索引擎是架构在许多搜索引擎之上的搜索引擎,它利用各个成员搜索引擎提供的服务,能够高效方便地找到这些文档,然后合并成员搜索引擎返回的结果呈现给用户,实现了一个元搜索引擎系统,并给出建立一个高效的元搜索引擎的关键技术和经验。  相似文献   

7.
基于DOM的结构化搜索引擎   总被引:2,自引:0,他引:2  
主要介绍了一种新的搜索引擎技术一结构化搜索引擎,分析了一般Internet网络搜索引擎的结构和特点,介绍了用DOM存取和处理HTML文件的原理和方法。  相似文献   

8.
靳美 《电脑》2000,(8):74-75
上网冲浪,如何才可以查找到自己需要的网络资源呢?当然要靠搜索引擎了,搜索引擎是查找Internet网络资源的一个重要工具。搜索引擎的主要任务是在Internet上搜索WEB服务器信息并将其自动索引,其索引内容存储于可供查询的大型数据库中。因此搜索引擎可以说是一个巨大的图书馆。只要您键入关键字及限定条件,它就能帮您迅速检索某一相关主题的网站。用户只需通过搜索引擎提供的链接地址就可以访问到相关信息。不过想要利用好搜索引擎可不是这么简单,下面我就重点介绍比较著名的中文搜索引擎及其使用方法。 一、普通搜…  相似文献   

9.
Internet上的文本数据挖掘   总被引:48,自引:3,他引:48  
1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的Internet信息仓库中占信息比重最大的数据类型却缺乏结构化、组织的规整性,并且随意地散布在这个网络的各个角落,还降低了人们对丰富的信息资源的利用效率。数据挖掘是人们对一些巨型数据库中的数据进行分析、使用感到力不从心时而发展出的一门新的技术,它将人工智能技术与数据库技术紧密结合起来,让计算机帮助人们从庞大的数据中智能地、自动地抽取有价值的知识模式,以满足人们不同应用的需要。当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称文本数据挖掘。Internet上缺乏结构化、组织规整性的超巨量文本数据自然让人们想到运用文本数据挖掘技术来帮助提高人们在Internet上检索信息、利用信息的效率。  相似文献   

10.
智能搜索引擎实例分析   总被引:8,自引:0,他引:8  
通过实例认真分析了目前中文搜索引擎技术的状况,并对现有先进的信息检索手段,人工智能、中文自然语言处理等技术进行了有力的描述,在此基础之上,对提出的以有序的知识库对无序的知识库的一个全新智能搜索引擎进行了实例分析。  相似文献   

11.
Web服务搜索技术综述*   总被引:1,自引:0,他引:1       下载免费PDF全文
随着Web服务应用的迅速发展与日益普及, 如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括:基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式。对现有主要Web服务搜索技术进行了详细评述。在对典型Web服务搜索技术分析比较的基础上, 指出了建立专用的Web服务搜索引擎的必要性以及所面临的问题与挑战。  相似文献   

12.
Queries to Web search engines are usually short and ambiguous, which provides insufficient information needs of users for effectively retrieving relevant Web pages. To address this problem, query suggestion is implemented by most search engines. However, existing methods do not leverage the contradiction between accuracy and computation complexity appropriately (e.g. Google's ‘Search related to’ and Yahoo's ‘Also Try’). In this paper, the recommended words are extracted from the search results of the query, which guarantees the real time of query suggestion properly. A scheme for ranking words based on semantic similarity presents a list of words as the query suggestion results, which ensures the accuracy of query suggestion. Moreover, the experimental results show that the proposed method significantly improves the quality of query suggestion over some popular Web search engines (e.g. Google and Yahoo). Finally, an offline experiment that compares the accuracy of snippets in capturing the number of words in a document is performed, which increases the confidence of the method proposed by the paper. Copyright © 2010 John Wiley & Sons, Ltd.  相似文献   

13.
Web使用挖掘技术的分析与研究*   总被引:6,自引:0,他引:6  
首先给出Web使用挖掘的定义和完整模型框架;然后对Web使用挖掘中主要步骤的最新研究进展状况作了详细的阐述和分析,其中包括数据采集、数据预处理、模式发现和模式分析;最后对未来的研究重点进行了展望.  相似文献   

14.
A Probabilistic Approach for Distillation and Ranking of Web Pages   总被引:1,自引:0,他引:1  
Greco  Gianluigi  Greco  Sergio  Zumpano  Ester 《World Wide Web》2001,4(3):189-207
A great number of recent papers have investigated the possibility of introducing more effective and efficient algorithms for search engines. In traditional search engines the resulting ranking is carried out using textual information only and, as showed by several works, they are not very useful for extracting relevant information. Present research, instead, takes a new approach, called Topic Distillation, whose main task is finding relevant documents using a different similarity criterion: retrieved documents are those related to the query topic, but which do not necessarily contain the query string. Current algorithms for topic distillation first compute a base set containing all the relevant pages and then, by applying an iterative procedure, obtain the authoritative pages. In this paper, we present a different approach which computes the authoritative pages by analyzing the structure of the base set. The technique applies a statistical approach to the co-citation matrix (of the base set) to find the most co-cited pages and combines a link analysis approach with the content page evaluation. Several experiments have shown the validity of our approach.  相似文献   

15.
Web使用挖掘是近年来Web数据挖掘中的研究热点。针对传统遗传算法在提取关联规则问题时常采用固定染色体交叉概率和染色体变异概率,容易出现早熟、收敛速度较慢的问题,提出了改进的遗传算法,并在关联规则的提取中增加了用户页面兴趣度这一阈值,成功地运用到某商业网站服务器日志挖掘。实验证明,这种改进的遗传算法能够有效避免早熟收敛现象,是一种有效的方法。  相似文献   

16.
Web挖掘研究     
随着网络的飞速发展Web挖掘技术已成为一个研究热点。该文就Web挖掘与相关研究进行了对比,介绍了Web挖掘的概念、分类及步骤。最后给出了Web挖掘的研究方向。  相似文献   

17.
搜索引擎剖析   总被引:8,自引:0,他引:8  
刘琨  郑有才 《微机发展》2004,14(3):19-22
搜索引擎相关技术的研究是目前互联网的热门研究课题。现有搜索引擎利用了大量的计算机研究成果,了解现有搜索引擎的优点和不足同时在实现的搜索引擎中扬长避短,对搜索引擎的剖析是非常必要的。文中指出Google的PageR ank技术在处理超链接双向影响上的不足。在实现搜索引擎的过程中,充分利用分析的结果改进PageRank算法,从而充分利用网页间的超链接信息提高了搜索结果的有效性。  相似文献   

18.
This article explores Internet search tools that harness emerging technologies and user-centric features such as Web 2.0 sites, mobile applications, metasearching, real-time information, peer-to-peer searches, visual interfaces, and computational abilities. Reference librarians everywhere have incorporated Google into their searching repertoires, but what about other search engines that feature “bleeding edge” technologies and human-friendly designs? Our article is a concise guide to nine innovative search engines—Silobreaker, Zuula, Bing, ChaCha, CompletePlanet, DuckDuckGo, Spezify, Wolfram|Alpha, and Wowd—which give us a glimpse into the future of searching technology. We conclude our article by discussing implications for reference services.  相似文献   

19.
This paper proposes an effective query-translation approach that enables a cross-language information retrieval (CLIR) service to be more easily supported in digital library systems that only contain monolingual content. A query-translation engine called LiveTrans is used to process the translation requests of cross-lingual queries from connected digital library systems. To automatically extract translations not covered by standard dictionaries, the engine is developed based on a novel integration of dictionary resources and Web mining approaches, including anchor-text and search-result methods. The engine exploits a broad range of multilingual Web resources used as live bilingual corpora to alleviate translation difficulties. It is shown to be particularly effective for extracting multilingual translation equivalents of query terms containing proper names or new terminology. The obtained results show the feasibility of and great potential for creating English-Chinese CLIR services in existing digital libraries and new applications in cross-language Web searching, although difficulties still remain that need to be investigated further.  相似文献   

20.
Web挖掘研究     
随着网络的飞速发展,Web挖掘技术已成为一个研究热点。该文就Web挖掘与相关研究进行了对比,介绍了Web挖掘的概念、分类及步骤,最后给出了Web挖掘的研究方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号