首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 124 毫秒
1.
对因特网上较著名的搜索引擎站点进行了详尽分析,着重分析了中文搜索引擎的特点,以及搜索引擎的主要评价标准。最后介绍了国内主要搜索引擎,为人们从因特网上更好地检索信息提供初步指南。  相似文献   

2.
一种专用的软件组件搜索引擎   总被引:3,自引:0,他引:3  
搜索引擎能帮助人们从因特网上获取信息或资源,但是直接使用现有的通用搜索引擎来搜索分布在因特网上的各种大型组件库中的软件组件,则并不适合。本文提出了一种新的专用软件组件搜索引擎。该搜索引擎可以在因特网上,基于组件的分类信息,搜索软件组件。它能够为检索和重用软件组件等活动,提供较好的支持。此外,还给出了该搜索引擎的设计方案。  相似文献   

3.
要想从因特网上找一份自己想要的资料或是其他资源,必须通过搜索引擎的帮助才可以实现。通常使用的都是Google、百度等,现在,Google推出了搜索引擎用户自己创建的服务,让搜索者可以自备一个搜索引擎,以后要想从因特网上找东西就可以使用自己的搜索引擎来进行了。不仅如此,甚至还可以把这个“自制”的搜索引擎嵌到自己的网站中挣广告费!  相似文献   

4.
要想从因特网上找一份自己想要的资料或是其他资源,必须通过搜索引擎的帮助才可以实现。通常使用的都是Google、百度等,现在,Google推出了搜索引擎用户自己创建的服务,让搜索者可以自备一个搜索引擎,以后要想从因特网上找东西就可以使用自己的搜索引擎来进行了。不仅如此,甚至还可以把这个“自制”的搜索引擎嵌到自己的网站中挣广告费!  相似文献   

5.
要想从因特网上找一份自己想要的资料或是其他资源,必须通过搜索引擎的帮助才可以实现.通常使用的都是Google、百度等,现在,Google推出了搜索引擎用户自己创建的服务,让搜索者可以自备一个搜索引擎,以后要想从因特网上找东西就可以使用自己的搜索引擎来进行了.不仅如此,甚至还可以把这个"自制"的搜索引擎嵌到自己的网站中挣广告费!  相似文献   

6.
随着因特网的迅速发展,人类社会的信息量迅速膨胀;搜索引擎的出现,解决了人们在海量数据中寻找自己需要信息的问题。本文通过对搜索引擎原理的分析,结合MAS的特点,设计了一个基于MAS兴趣模型的搜索引擎,并对引擎的工作原理进行了叙述。  相似文献   

7.
聚类分析在搜索引擎中的应用   总被引:8,自引:0,他引:8  
为了快速、准确地从因特网上找到人们所需的信息,对网页信息进行聚类分析是非常重要的。该文分析了几种适用于搜索引擎的聚类方法,并讨论了聚类分析在设计搜索引擎时的应用。  相似文献   

8.
随着因特网的迅猛发展,搜索引擎也在不断地发展。本文在分析传统搜索引擎弊端后,指出了搜索引擎发展的趋势:跨语言搜索引擎、多媒体搜索引擎、智能搜索引擎和基于智能代理技术的搜索引擎。最后,简要地给出了搜索引擎发展趋势所表现出的特点。  相似文献   

9.
王莉 《计算机与现代化》2011,(11):199-201,205
随着因特网技术的飞速发展,搜索引擎逐渐成为因特网重要的导航工具之一,而人们日常使用的搜索引擎代码并不开源,不利于研究学习。本文建立一个开源搜索引擎模型,并在ASP.NET中实现,为后续研究个性化搜索应用提供一个原型基础。  相似文献   

10.
随着因特网的迅猛发展,搜索引擎也在不断地发展.本文在分析传统搜索引擎弊端后,指出了搜索引擎发展的趋势:跨语言搜索引擎、多媒体搜索引擎、智能搜索引擎和基于智能代理技术的搜索引擎.最后,简要地给出了搜索引擎发展趋势所表现出的特点.  相似文献   

11.
本文通过应用Cranfield体系——构建查询样例集合、查询信息需求分类、抓取搜索引擎结果、规定标注准则、计算性能评价指标的基本流程,对目前常用中文搜索引擎,百度、谷歌、搜狗、搜搜、人民搜索性能从定量的角度,进行较为全面的评价。其结果可供用户在选择、利用这些搜索引擎时参考。  相似文献   

12.
提出了能够综合衡量搜索引擎工作性能的六个评测指标,选择了当今主流的三个搜索引擎:谷歌、雅虎和百度进行评测,成功地在两个大型的数据集上实现了整个自动评测系统。实验表明,谷歌工作性能最稳定;雅虎返回的第一个结果最能满足用户的要求,但会受时间因素的影响;百度明显地受关键字类别因素的影响。最后对中搜、狗、爱问进行了评测。  相似文献   

13.
陈浩  陶传奇  文万志 《计算机科学》2017,44(11):125-133
随着大数据的迅速发展,大数据应用层出不穷,诸如网购零售平台、人脸识别系统、智能决策系统、自助客服、看病导医系统等典型的大数据应用使得人们的生活越发便捷。搜索系统是人们最常使用的大数据应用之一。然而,搜索系统在不同平台上的功能各有侧重,其标准尚且不完善,搜索的质量参次不齐,无法得到保障。 与普通的文本搜索引擎相比,网购平台的搜索引擎增加了分类检索、筛选等特色功能,其质量的评价与保障更为复杂。通过对网络零售平台的搜索功能进行研究,针对网购平台搜索功能的质量评价提出了质量参考因素,针对质量因素提出了若干评价指标以及相应的实现算法,并通过实验来论证了质量指标的有效性。  相似文献   

14.
Li  Longzhuang  Shang  Yi 《World Wide Web》2000,3(4):241-247
In this paper, we present a new method for automatically comparing the performance, such as precision, of search engines. Based on queries randomly selected from a specific domain of interest, the method uses robots to automatically query the target search engines, evaluates the relevance of the returned links to the query either automatically based on the vector space model or manually, and then applies statistic measures, including the probability of win and the Friedman statistic, to compare the performance of search engines. We show the experimental results of the new method on three search engines, AltaVista, Google, and InfoSeek. The method arrived at the same performance comparison result in applying either the automatic relevance evaluation method or the manual method. In addition, our results show that the probability of win is a better metric than the Friedman statistic in performance comparison. The advantage of the new method is that it is fast, flexible, consistent, and can adapt to the fast changing search engines.  相似文献   

15.
16.
实时性是影响搜索引擎性能的重要因素.针对这个因素,提出一种可实时更新的倒排索引结构并将其应用于国产万亿次高性能计算平台KD-60.该方案采用主、辅倒排索引和内容过滤索引相结合的方式,实现了搜索过程的实时性.同时,我们将其应用于高性能绿色计算平台KD-60,使之在一定的程度上实现了搜索的高效能.实验证明,基于KD-60平台的倒排索引结构有效的解决了搜索引擎的实时性问题,并可作为绿色计算的实际应用的一个典型实例.  相似文献   

17.
网络数据的飞速增长为搜索引擎带来了巨大的存储和网络服务压力,大量冗余、低质量乃至垃圾数据造成了搜索引擎存储与运算能力的巨大浪费,在这种情况下,如何建立适合万维网实际应用环境的网页数据质量评估体系与评估算法成为了信息检索领域的重要研究课题。在前人工作的基础上,通过网络用户及网页设计人员的参与,文章提出了包括权威知名度、内容、时效性和网页外观呈现四个维度十三个因素的网页质量评价体系;标注数据显示我们的网页质量评价体系具有较强的可操作性,标注结果比较一致;文章最后使用Ordinal Logistic Regression 模型对评价体系的各个维度的重要性进行了分析并得出了一些启发性的结论 互联网网页内容和实效性能否满足用户需求是决定其质量的重要因素。  相似文献   

18.
The current proliferation of on-line information resources underscores the requirement for the ability to index collections of information and search and retrieve them in a convenient manner. This study develops criteria for analytically comparing the index and search engines and presents results for a number of freely-available search engines.A product of this research is a tool-kit capable of automatically indexing, searching, and extracting performance statistics from each of the focused search engines. This tool-kit is highly configurable and has the ability to run these benchmark tests against other engines as well.Results demonstrate that the tested search engines can be grouped into two levels. Level one engines are efficient on small- to medium-sized data collections, but show weaknesses when used for collections 100MB or larger. Level two search engines are recommended for data collections up to and beyond 100MB.  相似文献   

19.
《Computer Networks》1999,31(11-16):1291-1303
Recent research has studied how to measure the size of a search engine, in terms of the number of pages indexed. In this paper, we consider a different measure for search engines, namely the quality of the pages in a search engine index. We provide a simple, effective algorithm for approximating the quality of an index by performing a random walk on the Web, and we use this methodology to compare the index quality of several major search engines.  相似文献   

20.
Discovering the correct dataset in an efficient fashion is critical for effective simulations in the atmospheric sciences. Unlike text-based web documents, many of the large scientific datasets often contain binary encoded data that is hard to discover using popular search engines. In the atmospheric sciences, there has been a significant growth in public data hosting services. However, the ability to index and search has been limited by the metadata provided by the data host. We have developed an infrastructure-Atmospheric Data Discovery System (ADDS)-that provides an efficient data discovery environment for observational datasets in the atmospheric sciences. To support complex querying capabilities, we automatically extract and index fine-grained metadata. Datasets are indexed based on periodic crawling of popular sites and also of files requested by the users. Users are allowed to access subsets of a large dataset through our data customization feature. Our focus is the overall architecture, data subsetting scheme, and a performance evaluation of our system.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号