共查询到20条相似文献,搜索用时 218 毫秒
1.
2.
3.
网络信息资源呈指数级增长,面对用户越来越个性化的需求,主题网络爬虫应运而生。主题网络爬虫是一种下载特定主题网页的程序。利用在采集页面过程获得的特定信息,主题网络爬虫抓取的页面都是与主题相关的。基于主题网络爬虫的搜索引擎以及基于主题网络爬虫构建领域语料库等应用已经得到广泛运用。首先介绍了主题爬虫的定义、工作原理;然后介绍了近年来国内外关于主题爬虫的研究状况,并比较了各种爬行策略及相关算法的优缺点;最后提出了主题网络爬虫未来的研究方向。关键词: 相似文献
4.
刘晓魁 《网络安全技术与应用》2022,(5):17-19
网络爬虫和网络反爬虫在博弈中不断成长,网络爬虫的存在已经成为网络信息时代一种常态。随着大数据和人工智能技术的出现,网络爬虫也越来越规模化和智能化,对网络爬虫的研究也要越来越明晰且与时俱进。本文对目前网络爬虫的特征、分类、所使用的工作流程和爬行策略进行梳理和比较,为网络爬虫提供较全面的总结,为进一步研究网络爬虫和网络反爬虫提供重要参考。 相似文献
5.
6.
一种网络爬虫的带缓存非阻塞异步域名解析器模型及其性能分析 总被引:1,自引:0,他引:1
网络爬虫是搜索引擎的一个基本组件,网络爬虫抓取页面的效率直接影响搜索引擎提供的服务质量。除了可以通过改进网络爬虫的爬行策略来提高网络爬虫效率之外,也可以通过优化网络爬虫程序某方面的设计来消除特定的效率瓶颈。通过对网络爬虫结构和实际运行数据的分析,针对爬虫的DNS解析瓶颈,设计了一种带缓存异步域名解析器模型,并通过实验和一般DNS解析器模型进行了比较,实验结果证明这种模型对于减少程序等待解析域名的这一操作时间十分有效,显然也能够提高爬虫的整体效率。 相似文献
7.
本文分析了基于Python的新闻聚合系统网络爬虫,指的是根据Python的网络爬虫构建新闻聚合系统,利用爬虫获取新闻聚合系统的新闻数据,不同网站的页面布局是不同的,因此需要创建开源爬虫,可以在不同页面布局中获取数据。在网络爬虫开发过程中需要利用Python语言,而网络爬虫Web提取工具为BeautifulSoup,Web应用程序框架为Laravel,选用的后端语言为PHP。网络爬虫可以根据用户配置文件提取不同页面布局的数据,并且可以向数据库系统中导入提取的数据。 相似文献
8.
文竹 《计算机光盘软件与应用》2013,(20):50-51
网络爬虫的主要作用是获取互联网上的信息。我们在浏览网页时候所希望获取的信息都可以使用网络爬虫来抓取实现;网络爬虫从互联网上源源不断的抓取海量信息,搜索引擎结果中的信息都是来源于此。本文对基于C#开发的网络爬虫搜索引擎进行了详细的阐述。 相似文献
9.
10.
随着大数据时代的到来,越来越多的信息涌入互联网.以人工的形式在互联网中获取所需信息费时费力,而以网络爬虫的形式获取所需资源节省则大量人力物力财力.在通过网络爬虫获取所需资源的过程中爬虫需要模拟人工登录从而获取某些资源,网络爬虫的模拟登录是实现网络爬虫的一个重要环节,以Python语言作为开发语言,解决使用网络爬虫过程中所遇到的需要通过模拟OAuth2.0授权登录的问题.剖析了模拟登录整体流程,并且给出了爬虫通过OAuth2.0登录的具体的应用实例. 相似文献
11.
信息系统的可靠性需要从多个方面予以保障,比如系统调研、系统分析、网络架构、程序架构、代码设计等多个方面。本文讨论的问题是当整个系统的许多前期已经完成,真正进入系统的程序设计阶段,如何通过程序设计多层面保障信息系统可靠的研究,在这个阶段可以从三个层面进行讨论,首先要想完成信息系统的程序设计,必须要根据前期的系统分析先对信息系统对象进行抽象,形成不同的本信息系统必须的业务类;其次是针对具体的业务类进行精心的低层程序设计和所需的中间件应用;第三是在代码开发时必须考虑的几个方面。实际中用户使用信息系统是通过展现在他们面前的程序界面实现的,所以系统的程序设计的可靠与否,是整个信息系统建设的最后也是最关键的一环,因为它是信息系统设计中惟一交给用户操作使用的东西。 相似文献
12.
因特网的发展把人类带入了一个全新的媒体时代。今天网络已经深入到我们生活的每一个地方,网络动画、网络视频、虚拟网店等多媒体信息大量搬上网络。作为网络信息传播的载体——网页的设计也提出了更高的要求,而多媒体网页已经成为新媒体时代网页设计的发展趋势。 相似文献
13.
信息网络系统建设是一个复杂的系统工程,这么一个复杂的工程需要各方面互相配合,共同来实施。信息网络系统的勘测设计单位在信息网络系统建设过程中得地位十分重要,而目前我国在信息网络系统建设方面还没有实施勘测设计制度,本文将就信息网络系统勘测设计单位的重要性进行探讨。 相似文献
14.
在物联网环境下进行信息监控系统设计,实现对网络信息的监控和自适应采集,保障网络安全。针对采用传统的神经网络控制方法进行信息监控的数据挖掘准确性不好的问题,提出一种基于物联网和自组织映射SOM算法的信息监控系统设计方法,首先进行信息监控系统的总体设计和功能模块化分析,然后设计改进的SOM算法,应用在信息监控的数据挖掘和分类识别中,在程序加载模块中进行算法加载,最后在物联网环境下构建嵌入式Linux内核进行信息监控系统的软件设计和开发。系统仿真实验结果表明,采用该信息监控系统进行大型物联网的数据信息监控,对数据的准确挖掘和识别性能较好。 相似文献
15.
16.
介绍一个多媒体兴农信息服务平台的设计,该平台通过三网(通信网、电视网和计算机网)融合的现代信息技术,实现面向"三农"多种信息的共享和集中展示。包括系统设计目标、系统功能、系统组成和关键技术等。 相似文献
17.
许若权 《网络安全技术与应用》2014,(5):66-66
网络实现了信息交流和资源的共享,增加了人们获取信息的途径,网络平台成为企事业单位宣传和信息交流的主要媒体之一;因此,企业的网络信息安全将遇到新的问题与挑战.本文分析了当前网络信息安全存在的问题,并基于防火墙技术的网络系统安全进行详细的分析和设计. 相似文献
18.
许柔 《电脑编程技巧与维护》2009,(22):119-120
信息存储和利用的载体也是计算机网络构成的主要成分,系统的安全性直接关系到网络和信息的安全。对于系统安全来说,主要在于防止窃取数据和非法修改系统。从计算机网络管理的的角度,对系统安全设计进行了分析和探讨。 相似文献
19.
本文介绍了一种对等网络结构的分布式社区管理系统的设计。通过系统的需求分析、系统架构设计和软件设计,实现了对等网络架构下的社区管理系统。解决了小型分布式应用系统的P2P节点通信、信息同步和任务协同问题。实验结果表明,可作为对等网络结构下的分布式应用信息系统的设计与实现的参考。 相似文献
20.
林贤斌 《网络安全技术与应用》2014,(9):208-209
随着计算机网络时代的飞速发展和普及,企业的生产经营活动全球化战略的推进,企业从原材料的采购、产品的生产、销售等各个环节都将通过网络进行控制;本文对外贸购销系统进行了设计,系统可以实现产品信息、成交方式、结汇方式等基本设置,并实现各种信息查询、信息管理等各种功能,该系统设计简洁,应用效果良好. 相似文献