首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
蚁群算法在搜索引擎系统中的应用研究   总被引:2,自引:0,他引:2  
蚁群算法是Marco Dorigo等学者在真实蚂蚁觅食行为的启发下提出的一种群智能优化算法。为了优化搜索引擎系统中的搜索代价,文中采用理论分析和实验相结合的方式,研究了蚁群算法在搜索引擎系统中的应用。提出了基于蚁群算法的搜索引擎算法,并设计了适合该算法的搜索引擎系统。从理论上阐述了蚁群算法的开放性和自我动态调整性对搜索引擎系统的适应,在此基础上分析了蚁群搜索引擎算法的优点。实验仿真证明了该算法的有效性和优越性。  相似文献   

2.
搜索引擎中的网络数据挖掘技术   总被引:4,自引:0,他引:4  
万维网包含大量的信息,而且随着其快速的增长而变得越来越复杂,这就导致了现在用户定位相关和高质量信息的搜索变得越来越难。将网络数据挖掘技术应用于搜索引擎将大大改善搜索引擎的搜索效率以及搜索质量。提出了具体的算法,并阐述了此算法在搜索引擎中的应用。  相似文献   

3.
基于PageRank算法的搜索引擎优化策略   总被引:5,自引:0,他引:5  
张巍  李志蜀 《计算机应用》2005,25(7):1711-1712,1718
在介绍Google等搜索引擎最常用的PageRank搜索结果排名算法的基础上,详细阐述了各种网页链接结构对基于PageRank算法的网站搜索引擎排名结果可能产生的影响,并分析了实际应用中网站针对PageRank算法的各种优化策略,讨论了各自的优点。  相似文献   

4.
用信息-摘要算法提高Web信息检索效率的研究   总被引:1,自引:0,他引:1  
针对常用搜索引擎返回给用户的信息中包含大量重复网页的缺陷,提出了一种基于信息-摘要算法的去除重复网页算法。由于算法的成熟,该算法易实现,可移植性强。实验证明该算法能有效地去除常用搜索引擎返回的重复网页,从而为Intenret用户提高信息检索效率,具有较强的实用价值。  相似文献   

5.
搜索引擎的设计剖析   总被引:6,自引:0,他引:6       下载免费PDF全文
本文介绍了搜索引擎的四个组成部分:搜索器、索引器、检索器和用户接口,并分析其工作原理,给出搜索引擎中包含的关键技术算法,分词技术、多路归并算法和大文件处理技术;最后结合当前最新的几种搜索引擎在多语言处理,专业化和有效性等方面的技术改进目标。  相似文献   

6.
元搜索引擎排序技术综述*   总被引:5,自引:0,他引:5  
摘要:如何排序是实现元搜索引擎的一项关键技术,排序算法的好坏直接决定着元搜索引擎的性能。对元搜索引擎常用的排序算法根据其发展先后顺序作了介绍,对一些经典的算法进行了分析和评价,归纳出元搜索引擎排序算法适用的不同环境,最后对元搜索引擎排序算法未来发展方向作了技术展望。  相似文献   

7.
本文对当前的搜索引擎原理进行了简要的分类介绍,概述了中文搜索引擎的特殊性和难点,并给出了两种中文分词算法。  相似文献   

8.
元搜索引擎的核心技术是排序算法.在研究元搜索引擎排序算法的基础上,通过合理简化等一系列措施建立数学模型,抽象出元搜索引擎排序算法的基本框架.随后结合各成员搜索引擎的市场份额及各成员搜索引擎的搜索结果,给出了一种新的元搜素引擎排序算法.该算法简单且易于实现.  相似文献   

9.
集中式搜索技术有选择地找出与预定义主题集相关的页面,与传统搜索引擎相比具有可针对个人喜好定制,规模小、索引量少,更新查询速度快等特点,设计了一个集中式搜索引擎,并简要介绍该搜索引擎的系统结构,最后实现了一些关键算法。  相似文献   

10.
为改进元搜索引擎查询速度慢、独立性差的缺点,本文设计了一个元搜索引擎的结果处理模型。该模型结合元搜索引擎的特点设计了一种4级结果集的结构,提高了元搜索引擎结果处理的效率。在结果提取部分提出了根据反馈信息自动调整权重的算法(FBWM),在没有人工干预的情况下自动监视各独立搜索引擎的性能变化并随之动态调整其权重。在结果排序部分,提出了改进的位置/全文排序法(IPFTS),在算法中引入了词条匹配等级的概念,不但能提高搜索结果和查询串相关度的精度,还能保证排名在前的搜索结果的URL的有效性。  相似文献   

11.
中文搜索引擎现状与展望   总被引:19,自引:0,他引:19  
本文介绍了中文搜索引擎的发展现状,分析了中文搜索引擎中存在的问题,以及与国外先进的搜索引擎的差距,提出了中文搜索引擎的发展方向。  相似文献   

12.
Although search engines are essential tools for finding information on the World Wide Web, the effective use of search engines for information retrieval (IR) is a crucial challenge for any Internet user. Based on the user-focused approach, this study investigates individual information retrieval behaviors using information processing theory. The results show that experience with search engines significantly affects users’ attitudes toward search engines for information retrieval, the query-based service is more popular than the directory-based service, users are not completely satisfied with the precision of retrieved information and the response time of search engines, and users’ motivation is a key factor that predicts their intention to use search engines for information retrieval. Furthermore, this study proposes a conceptual model for investigating individual attitudes toward search engines for information retrieval.  相似文献   

13.
基于相关术语集的搜索引擎选择   总被引:1,自引:0,他引:1  
欧洁 《计算机科学》2003,30(7):56-59
1 引言 Web从1991年出现以来,已经发展成为一个巨大的全球化信息空间,而且其信息容量仍在以指数形式飞速增长。面对海量Web信息资源,如何有效地检索Web信息,以帮助用户从大量文档信息集合中找到对给定查询请求有用的文档子集,也就成为一项重要而迫切的研究课题。  相似文献   

14.
智能搜索引擎技术的研究与发展   总被引:26,自引:1,他引:25  
搜索引擎已经成为互联网上最重要的工具之一。而目前的搜索引擎都存在着一定的不足。文章系统地阐述了当前搜索引擎的相关技术,展望搜索引擎技术的发展趋势。最后提出搜索引擎的出路应该在于分布式协作的观点。  相似文献   

15.
The current proliferation of on-line information resources underscores the requirement for the ability to index collections of information and search and retrieve them in a convenient manner. This study develops criteria for analytically comparing the index and search engines and presents results for a number of freely-available search engines.A product of this research is a tool-kit capable of automatically indexing, searching, and extracting performance statistics from each of the focused search engines. This tool-kit is highly configurable and has the ability to run these benchmark tests against other engines as well.Results demonstrate that the tested search engines can be grouped into two levels. Level one engines are efficient on small- to medium-sized data collections, but show weaknesses when used for collections 100MB or larger. Level two search engines are recommended for data collections up to and beyond 100MB.  相似文献   

16.
集成搜索引擎的文本数据库选择   总被引:8,自引:0,他引:8  
用户需要检索的信息往往分散存储在多个搜索多个搜索引擎各自的数据库里,对普通用户而言,访问多个搜索引擎并从返回的结果中分辨出确实有网页是一件费时费力的工作,集成搜索引擎则可以提供给用户一个同时记问多个搜索引擎人集成环境,集成搜索引擎能将其接收到的用户查询提交给底层的多个搜索引擎进行搜索,作为一种搜索工具,集成搜索引擎具有如WEB查询覆盖面比传统引擎更大,引警有更好的可扩展性等优点,讨论了解决集成搜索引擎的数据库选择问题的多种技术,针对用户提交的查询要求,通过数据库选择可以选定最有可能返回有用信息的底层搜索引擎。  相似文献   

17.
Because they implement vulnerable security policies, search engines are excellent tools for helping hackers to attack machines anonymously, search for easy targets or gather confidential data. Securing all channels against hackers trying to penetrate a vulnerable system isn't possible, but there is no reason for search engines to be wide-open channels that continue to help hackers find and penetrate weak systems. Because it is so easy to use a search engine to cloak an attack, search-engine-based hacker abuse has become a real threat that poses serious risks. However, not all blame should fall on those who operate the search engines. Search engines aren't responsible for the huge numbers of poorly configured and insecure machines all over the Internet even if the search engines do aid in identifying them, but the search engines must take some blame if they continue to provide easy ways to locate weak and penetrable machines  相似文献   

18.
图书垂直搜索引擎是当前专业搜索引擎的重要组成部分.本文对传统图书搜索引擎存在的问题(信息内容形式单一、缺少个性化服务和用户体验效果差)进行了分析,提出相应的解决方案,并对其中的部分关键技术进行了研究.最后,对相关的实现进行了细化.  相似文献   

19.
本文介绍了搜索引擎发展过程中出现的一种新技术——多元搜索引擎。分析了多元搜索引擎的现状,并对典型的多元搜索引擎系统进行了介绍。同时提出了多元搜索引擎发展过程中有待改进的一面。  相似文献   

20.
Metasearch engines offer better coverage and are more fault-tolerant and expandable than single search engines. A metasearch engine is required to post queries with and obtain retrieval results from several other Internet search engines. In this paper, we describe the use of the extensible style language (XSL) to support metasearches. We show how XSL can transform a query, expressed in XML, into different forms for different search engines. We show how the retrieval results could be transformed into a standard format so that the metasearch engine can interpret the retrieved data, filtering the irrelevant information (e.g. advertisement). The proposed structure treats the metasearch engine and the individual search engines as separate modules with a clearly defined communication structure through XSL. Thus, the system is more extensible than coding the structure and syntactic transformation processes. It allows other new search engines to be included just through plug-and-play, requiring only that the new transformation of XML for this search engine be included in the XSL.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号