共查询到20条相似文献,搜索用时 93 毫秒
1.
首先分析了搜索引擎的工作原理,其次简要设计了搜索引擎在网络信息挖掘中应用,并进一步研究了搜索引擎的应用实现,涉及到挖掘预处理、挖掘训练以及信息文件的操作。对搜索引擎的应用研究起到一定的借鉴作用。 相似文献
2.
黄德玲 《数字社区&智能家居》2004,(5M):32-34
本文阐述了网络检索和联机检索的概念,采用对比的方法论述了基于Intenet的网络检索和传统的联机检索之间的异同.并分析了网络检索与联机检索各自的优缺点及两者今后的发展方向,以便更好地发挥两者的优势,取长补短,提高检索的整体效应。 相似文献
3.
数据挖掘技术在网络业务流设计中的应用 总被引:3,自引:0,他引:3
论述了数据挖掘技术在网络业务流设计中应用的必要性和可行性,探讨了在进行网络业务分析时运用数据挖掘技术的全过程,并指出该分析方法是以业务为分析单位的,运用该方法可以从业务角度对网络状况和网络行为进行分析。 相似文献
4.
基于元搜索引擎的研究 总被引:1,自引:0,他引:1
元搜索引擎通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制.介绍了元搜索引擎分类与实现技术,结合中外元搜索引擎的实例,对使用元搜索引擎存在的问题、选择和设计元搜索引擎及元搜索引擎的发展进行分析、探讨. 相似文献
5.
聂璐 《数字社区&智能家居》2009,(9X):7736-7737
网络信息挖掘能为管理决策起到至关重要的作用。该文在明确搜索引擎及信息挖掘意义的基础上,分析了搜索引擎的工作原理,并通过研究网络信息挖掘系统,探讨了搜索引擎在网络信息挖掘中的应用设计及实现。 相似文献
6.
7.
基于DOM的结构化搜索引擎 总被引:2,自引:0,他引:2
主要介绍了一种新的搜索引擎技术一结构化搜索引擎,分析了一般Internet网络搜索引擎的结构和特点,介绍了用DOM存取和处理HTML文件的原理和方法。 相似文献
8.
9.
Internet上的文本数据挖掘 总被引:48,自引:3,他引:48
1 引言今天Internet已不再是科学家及工程师们独享的通讯工具,已成为数字化时代的世界性图书馆,变成了为各行各业的人们交流思想、获取信息的便利手段。人们在使用WWW浏览服务时,检索、获取最多的信息数据就是文本数据。但这种在巨大的Internet信息仓库中占信息比重最大的数据类型却缺乏结构化、组织的规整性,并且随意地散布在这个网络的各个角落,还降低了人们对丰富的信息资源的利用效率。数据挖掘是人们对一些巨型数据库中的数据进行分析、使用感到力不从心时而发展出的一门新的技术,它将人工智能技术与数据库技术紧密结合起来,让计算机帮助人们从庞大的数据中智能地、自动地抽取有价值的知识模式,以满足人们不同应用的需要。当数据挖掘的对象完全由文本这种数据类型组成时,这个过程就称文本数据挖掘。Internet上缺乏结构化、组织规整性的超巨量文本数据自然让人们想到运用文本数据挖掘技术来帮助提高人们在Internet上检索信息、利用信息的效率。 相似文献
10.
11.
随着Web服务应用的迅速发展与日益普及, 如何快速、准确地搜索到用户所需的Web服务成为了制约Web服务发展的关键问题之一。目前的Web服务搜索技术包括:基于UDDI注册中心、通过Web服务网站、使用专用搜索引擎与使用通用搜索引擎四种方式。对现有主要Web服务搜索技术进行了详细评述。在对典型Web服务搜索技术分析比较的基础上, 指出了建立专用的Web服务搜索引擎的必要性以及所面临的问题与挑战。 相似文献
12.
Queries to Web search engines are usually short and ambiguous, which provides insufficient information needs of users for effectively retrieving relevant Web pages. To address this problem, query suggestion is implemented by most search engines. However, existing methods do not leverage the contradiction between accuracy and computation complexity appropriately (e.g. Google's ‘Search related to’ and Yahoo's ‘Also Try’). In this paper, the recommended words are extracted from the search results of the query, which guarantees the real time of query suggestion properly. A scheme for ranking words based on semantic similarity presents a list of words as the query suggestion results, which ensures the accuracy of query suggestion. Moreover, the experimental results show that the proposed method significantly improves the quality of query suggestion over some popular Web search engines (e.g. Google and Yahoo). Finally, an offline experiment that compares the accuracy of snippets in capturing the number of words in a document is performed, which increases the confidence of the method proposed by the paper. Copyright © 2010 John Wiley & Sons, Ltd. 相似文献
13.
Web使用挖掘技术的分析与研究* 总被引:6,自引:0,他引:6
首先给出Web使用挖掘的定义和完整模型框架;然后对Web使用挖掘中主要步骤的最新研究进展状况作了详细的阐述和分析,其中包括数据采集、数据预处理、模式发现和模式分析;最后对未来的研究重点进行了展望. 相似文献
14.
A great number of recent papers have investigated the possibility of introducing more effective and efficient algorithms for search engines. In traditional search engines the resulting ranking is carried out using textual information only and, as showed by several works, they are not very useful for extracting relevant information. Present research, instead, takes a new approach, called Topic Distillation, whose main task is finding relevant documents using a different similarity criterion: retrieved documents are those related to the query topic, but which do not necessarily contain the query string. Current algorithms for topic distillation first compute a base set containing all the relevant pages and then, by applying an iterative procedure, obtain the authoritative pages. In this paper, we present a different approach which computes the authoritative pages by analyzing the structure of the base set. The technique applies a statistical approach to the co-citation matrix (of the base set) to find the most co-cited pages and combines a link analysis approach with the content page evaluation. Several experiments have shown the validity of our approach. 相似文献
15.
Web使用挖掘是近年来Web数据挖掘中的研究热点。针对传统遗传算法在提取关联规则问题时常采用固定染色体交叉概率和染色体变异概率,容易出现早熟、收敛速度较慢的问题,提出了改进的遗传算法,并在关联规则的提取中增加了用户页面兴趣度这一阈值,成功地运用到某商业网站服务器日志挖掘。实验证明,这种改进的遗传算法能够有效避免早熟收敛现象,是一种有效的方法。 相似文献
16.
谢海艇 《数字社区&智能家居》2009,5(8):6097-6098
随着网络的飞速发展Web挖掘技术已成为一个研究热点。该文就Web挖掘与相关研究进行了对比,介绍了Web挖掘的概念、分类及步骤。最后给出了Web挖掘的研究方向。 相似文献
17.
18.
This article explores Internet search tools that harness emerging technologies and user-centric features such as Web 2.0 sites, mobile applications, metasearching, real-time information, peer-to-peer searches, visual interfaces, and computational abilities. Reference librarians everywhere have incorporated Google into their searching repertoires, but what about other search engines that feature “bleeding edge” technologies and human-friendly designs? Our article is a concise guide to nine innovative search engines—Silobreaker, Zuula, Bing, ChaCha, CompletePlanet, DuckDuckGo, Spezify, Wolfram|Alpha, and Wowd—which give us a glimpse into the future of searching technology. We conclude our article by discussing implications for reference services. 相似文献
19.
This paper proposes an effective query-translation approach that enables a cross-language information retrieval (CLIR) service to be more easily supported in digital library systems that only contain monolingual content. A query-translation engine called LiveTrans is used to process the translation requests of cross-lingual queries from connected digital library systems. To automatically extract translations not covered by standard dictionaries, the engine is developed based on a novel integration of dictionary resources and Web mining approaches, including anchor-text and search-result methods. The engine exploits a broad range of multilingual Web resources used as live bilingual corpora to alleviate translation difficulties. It is shown to be particularly effective for extracting multilingual translation equivalents of query terms containing proper names or new terminology. The obtained results show the feasibility of and great potential for creating English-Chinese CLIR services in existing digital libraries and new applications in cross-language Web searching, although difficulties still remain that need to be investigated further. 相似文献
20.
谢海艇 《数字社区&智能家居》2009,(22)
随着网络的飞速发展,Web挖掘技术已成为一个研究热点。该文就Web挖掘与相关研究进行了对比,介绍了Web挖掘的概念、分类及步骤,最后给出了Web挖掘的研究方向。 相似文献