共查询到20条相似文献,搜索用时 703 毫秒
1.
研究实现了一个分布式网络爬虫系统.系统架构主要分为控制节点和爬行节点两部分,并描述了分布式系统关键技术的解决方案.系统采用二级哈希映射算法进行任务分配以解决基于目标导向、负载均衡的URL分配问题,使用消息通信使节点相互协作,提出利用遗传算法作为该主题爬虫系统的搜索策略,并给出了网页更新策略的改进方法. 相似文献
2.
3.
4.
基于XML-RPC技术的分布式教育资源库系统 总被引:5,自引:0,他引:5
针对目前教育资源分布分散,无法被有效地利用和共享等问题,提出了分布式教育资源库系统的设计思想,系统为多个分布式资源库节点建立统一的资源目录中心,采用XML-RPC技术解决资源目录中心和分布式资源库节点之间信息的同步问题,有效地实现了教育资源的共建共享。 相似文献
5.
6.
在分布式OA系统中,数据资源的分布会影响整个OA系统的效率。为了能够合理进行数据资源分布,提高OA系统的效率,提出了一种基于分布式数据资源的分布模型及算法,该算法给出了可减少网络流量、降低整个分布式系统开销的数据分布方案,由此提高OA系统的整体性能,使之更能适应OA应用需要。 相似文献
7.
为了改善网络机器人的爬行性能以及提高系统体系结构的通用性,提出了基于Web Service的新型分布式网络机器人体系架构.分析了分布式网络机器人软件中的关键数据操作,并将这些功能封装在Web Service中,基于Web向网络机器人客户结点提供统一的数据服务,降低了网络机器人爬行客户端对网络环境的依赖性.设计了分布式爬行所需的均衡负载、URL队列操纵和网页消重等算法,实现了分布式网络机器人软件原型.实验结果表明,该原型的性能明显优于单机模式下的网络爬行,且网页消重、均衡负载算法是可行的. 相似文献
8.
针对分布式多交互虚拟现实系统场景渲染的协同控制问题,构建了基于分布式开放灵活的多交互虚拟现实系统结构,将协同交互技术集成到虚拟现实系统设计中,设计包含控制平台、网络服务平台和渲染平台的系统架构,提出了一种基于OGRE的分布式多交互实时协同渲染方法。完成了单个控制节点对应多个渲染节点时,多个渲染节点渲染场景的实时同步,以及多个控制节点在同一场景中的协同、交互。此研究成果应用于河北大学虚拟漫游交互控制平台,具有广阔应用的前景。 相似文献
9.
10.
目前大多数的Peer-to-Peer(P2P)系统只支持基于文件标识的搜索,用户不能根据文件的内容进行搜索.Top-k查询被广泛地应用于搜索引擎中,获得了巨大的成功.可是,由于P2P系统是一个动态的、分散的系统,在P2P环境下进行top-k查询是具有挑战性的.提出了一种在集中式P2P系统中的基于中心文档的层次化的top-k查询算法.首先,采用层次化的方法实现分布式的top-k查询,将结果的合并和排序分散到P2P网络中的各个节点上,充分利用了网络中的资源.其次,将节点返回的结果录入到中心文档中,然后确定其分数上限,对节点进行选择,提高了查询效率. 相似文献
11.
一种基于智能体的Web文档预取模式 总被引:3,自引:2,他引:1
文章深入分析了用户对Internet资源的访问模式和web文档自身的更新模式,并提出了一个新的基于智能体的web文档预取系统结构。在这个系统结构基础上,通过用户存取日志及各种算法,发现特定用户感兴趣的主题,实现对兴趣文档的主动预取,从而提高分布式信息系统上信息的获取效率。 相似文献
12.
基于相关术语集的搜索引擎选择 总被引:1,自引:0,他引:1
1 引言 Web从1991年出现以来,已经发展成为一个巨大的全球化信息空间,而且其信息容量仍在以指数形式飞速增长。面对海量Web信息资源,如何有效地检索Web信息,以帮助用户从大量文档信息集合中找到对给定查询请求有用的文档子集,也就成为一项重要而迫切的研究课题。 相似文献
13.
如今互联网资源迅速膨胀,搜索引擎能够从浩如烟海的杂乱信息中抽出一条清晰的检索路径,让用户获得自己需要的信息.由蜘蛛程序实现的网页抓取模块是搜索引擎系统提供服务的基础,从资源的角度决定了整个系统的成败.鉴于此,介绍搜索引擎系统的基本工作原理,分析网页抓取模块的工作流程,研究开源网络蜘蛛Heritrix的几个关键组件,在充分了解Heritrix构架的基础上扩展Extractor组件,成功实现个性化的抓取逻辑. 相似文献
14.
随着互联网信息的爆炸式增长,搜索引擎和大数据等学科迫切需要一种高效、稳定、可扩展性强的爬虫架构来完成数据的采集和分析.本文借助于对等网络的思路,使用分布式哈希表作为节点间的数据交互的载体,同时针对网络爬虫自身的特点,对分布式哈希表的一种实现——Kademlia协议进行改进以满足分布式爬虫的需求.在此基础上设计并完善了具有可扩展性和容错性的分布式爬虫集群.在实际试验中,进行了单机多线程实验和分布式集群的实验,从系统性能角度和系统负载角度进行分析,实验结果表明了这种分布式集群方法的有效性. 相似文献
15.
随着Internet的迅猛发展.网络用户数量骤增,然而由于网络和硬件资源的局限性,使得传统的C\S与B\S架构下的在线教育资源系统不堪重负,文中提出一种基于SOA(Service Oriented Architecture)的分布式处理的架构模式MIX\S,充分并合理利用硬件和网络资源,动态地满足在线教育资源系统的用户规模需求。以程序设计竞赛系统为研究背景,提出分布式程序设计竞赛系统,并采用本体论的方法为系统建立一个信息完整和语义清晰的概念模型。 相似文献
16.
17.
Punam Bedi Anjali Thukral Hema Banati Abhishek Behl Varun Mendiratta 《计算机科学技术学报》2012,27(6):1233-1242
The Web comprises of voluminous rich learning content.The volume of ever growing learning resources however leads to the problem of information overload.A large number of irrelevant search results generated from search engines based on keyword matching techniques further augment the problem.A learner in such a scenario needs semantically matched learning resources as the search results.Keeping in view the volume of content and significance of semantic knowledge,our paper proposes a multi-threaded semantic focused crawler(SFC) specially designed and implemented to crawl on the WWW for educational learning content.The proposed SFC utilizes domain ontology to expand a topic term and a set of seed URLs to initiate the crawl.The results obtained by multiple iterations of the crawl on various topics are shown and compared with the results obtained by executing an open source crawler on the similar dataset.The results are evaluated using Semantic Similarity,a vector space model based metric,and the harvest ratio. 相似文献
18.
Habib M. Ammari Author Vitae 《Information Sciences》2007,177(8):1806-1833
The mobile Internet provides mobile nodes with continuous access to the Internet resources. This type of service is guaranteed only if these mobile nodes are one-hop away from the edge of the Internet. Mobile ad hoc networks (MANET), however, enable multi-hop communication between mobile nodes. A more promising goal would be to connect MANET to the Internet, thus enabling mobile nodes to benefit from the multi-hop nature of MANET so they can to share access to the Internet resources with the stationary nodes. This paper aims to study a three-tier architecture to provide MANET nodes with multi-hop Internet connectivity, evaluate its performance through extensive experiments with respect to a set of decision parameters, and outline the lessons learned from these experiments. 相似文献
19.
搜索引擎优化的作弊与防范 总被引:1,自引:0,他引:1
随着信息技术的飞速发展,人们越来越多的通过搜索引擎获取信息。快速增长的互联网信息在提供丰富的资源的同时也催生了大量的搜索引擎作弊的行为。本文先是通过对搜索引擎优化的作弊手段进行分析进而提出防范作弊的几种方法。 相似文献