共查询到19条相似文献,搜索用时 93 毫秒
1.
网格计算的目标之一是聚集广泛分布的资源,向用户提供各种应用工具的一体化透明服务。本文总结了网格系统的体系结构和特征,分析网格任务调度算法的基本原理和性能指标。然后从不同的角度来讨论各种网格调度算法,并对其进行分类和比较,最后指出了网格调度算法的研究新方向,为网格任务调度的研究提供了很大参考价值。 相似文献
2.
浅谈搜索引擎及其发展趋势 总被引:4,自引:0,他引:4
介绍了搜索引擎的基本构成、性能评价指标和采用的主要技术,对传统搜索引擎的分类、工作原理、特点和存在的不足进行了综合分析,指出了研究和开发具有多媒体搜索功能或基于语义网技术的智能代理搜索引擎、基于P2P或网格计算技术的分布式体系结构的搜索引擎、具有交叉语言检索功能的搜索引擎是搜索引擎的未来发展趋势。 相似文献
3.
4.
5.
近年来,随着网络数据挖掘技术的迅猛发展,如何从搜索引擎查询日志中找到有用的信息成为一个重要的研究方向.首先详细讨论了Beeferman提出的针对搜索引擎查询日志的凝聚式聚类算法以及噪声数据对该算法的影响,指出了Chan的改进算法中的一个错误,最后提出一个新的改进算法,并且通过模拟实验对几种不同的算法进行了对比. 相似文献
6.
基于Lucene 网页排序算法的改进 总被引:3,自引:1,他引:2
在分析现有的词频位置加权排序法、Direct Hit算法、PageRank算法和Lucene的网页排序算法后,将这三种著名的算法思想运用到Lucene的网页排序算法中,并设计了一个基于Lucene的糖业专业搜索引擎,重点介绍该搜索引擎的检索功能。最后,通过在所设计好的糖业专业搜索引擎进行实验,验证改进后Lucene的网页排序算法,实验结果表明改进后的排序算法能够提高检索结果的质量,能够更准确地将结果信息反馈给用户。 相似文献
7.
从Web中快速、准确地检索出所需信息的迫切需求催生了专业搜索引擎技术。在专业搜索引擎中,网络爬虫(Crawler)负责在Web上搜集特定专业领域的信息,是专业搜索引擎的重要核心部件。该文对中文专业网页的爬取问题进行了研究,基于KL距离验证了网页内容与链接前后文在分布上的差异,在此基础上提出了以链接锚文本及其前后文为特征、Nave Bayes分类器制导的中文专业网页爬取算法,设计了自动获取带链接类标的训练数据的算法。以金融专业网页的爬取为例,分别对所提出的算法进行了离线和在线测试,结果表明,Nave Bayes分类器制导的网络爬虫可以达到近90%的专业网页收割率。 相似文献
8.
9.
网格资源调度算法研究 总被引:4,自引:3,他引:1
网格资源调度算法是影响网格成功与否的关键技术之一.首先对网格资源调度方法从不同的视角进行了分类,从三个方面阐述了网格资源调度的性能指标,并着重比较分析了几种典型的网格资源调度算法,包括Min-min算法、Max-min算法、基于经济模型的调度算法、基于遗传算法以及基于模拟退火算法的网格资源调度算法等,指出各种算法性能上尚存的不足之处并对下一步如何改进给出建议,最后给出资源调度的研究展望.文中为网格资源调度算法的研究提供了很好的参考. 相似文献
10.
11.
Comparison of three vertical search spiders 总被引:1,自引:0,他引:1
The Web's dynamic, unstructured nature makes locating resources difficult. Vertical search engines solve part of the problem by keeping indexes only in specific domains. They also offer more opportunity to apply domain knowledge in the spider applications that collect content for their databases. The authors used three approaches to investigate algorithms for improving the performance of vertical search engine spiders: a breadth-first graph-traversal algorithm with no heuristics to refine the search process, a best-first traversal algorithm that uses a hyperlink-analysis heuristic, and a spreading-activation algorithm based on modeling the Web as a neural network. 相似文献
12.
13.
具有概念联想功能的特定领域分词词典的自动构建 总被引:3,自引:0,他引:3
提出了一种基于PAT树型结构的高频字串提取的改进算法。并以此用来获得特定领域网页中的未登录词集合,利用基于语义距离的概念相似度计算公式来获得任一概念的相关概念,从而给出了用于特定领域搜索引擎的语义词典完整的自动构建方法。将生成的语义词典用于搜索引擎FlyingScnder中。实验结果证明新的词典比原有的手工构建的词典分词效果要理想得多。而且提供了概念联想的功能。 相似文献
14.
15.
个性化搜索引擎系统机制的研究 总被引:2,自引:0,他引:2
随着网络信息资源的迅速增加,个性化信息服务越来越成为信息检索领域中研究的热点,针对传统搜索引擎系统的缺点,提出了一种新型个性化搜索引擎系统的体系结构,并在此基础上给出了系统中个性化机制的相关算法,同时使用基于关键词的搜索,利用Web挖掘技术,在实现为不同用户提供不同检索结果的同时提高了个性化查询的精确度和速度,保证了全查率. 相似文献
16.
17.
18.
19.
This study proposes to use genetic algorithms for defining the topic boundaries in search of engine transaction logs. Users are interested in multiple topics during a search session, and genetic algorithms are used in this study to determine whether a search engine user has changed topics during a session. Sample data logs from FAST and Excite search engines were analyzed. The findings show that genetic algorithms are fairly successful in identifying topic continuations and shifts in search engine transaction logs. 相似文献