面向海量网络数据的收集方法研究与分析期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

面向海量网络数据的收集方法研究与分析

作者姓名：	鲜敏

作者单位：	陕西省地震局,西安 710068

摘要：	网络爬虫是当前应用最普遍的针对海量网络数据的收集方法,其通过一定规则和URL自动抓取互联网信息及数据,主要是由程序来实现的.研究和分析了海量网络数据收集方法的理论基础,针对微博用户信息数据收集,提出了一种基于Scrapy框架的爬虫方法.
关键词：	网络数据爬虫微博 Scrapy框架
本文献已被万方数据等数据库收录！