基于Scrapy的网络爬虫设计与实现期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于Scrapy的网络爬虫设计与实现

引用本文：	云洋.基于Scrapy的网络爬虫设计与实现[J].电脑编程技巧与维护,2018(9):19-21,58.

作者姓名：	云洋

作者单位：	山东省青岛第五十八中学,山东青岛,266101

摘要：	互联网中包含大量有价值的数据,网络爬虫通过既定规则可以自动地抓取互联网的网页数据并下载至本地存储.研究了网络爬虫的工作原理和Scrapy框架模块,提出了基于Scrapy框架构建工程化网络爬虫爬取定向网页数据的4步流程法,基于此方法步骤构建网络爬虫实现2018年高校自主招生简章数据的爬取和存储.实验结果证明,基于Scrapy框架可有效快捷地构建工程化网络爬虫.
关键词：	Python语言网络爬虫 Scrapy框架 4步流程
本文献已被万方数据等数据库收录！