首页 | 本学科首页   官方微博 | 高级检索  
     

基于Python3爬虫获取最新上架图书的实现
引用本文:吴剑冰.基于Python3爬虫获取最新上架图书的实现[J].电脑编程技巧与维护,2018(4):31-33,39.
作者姓名:吴剑冰
作者单位:浙江海洋大学石化与能源工程学院,浙江舟山,316000
摘    要:在大数据时代,利用网络爬虫自动定向采集多网页有用的信息,并将爬取信息储存至数据库,Excel,Word等,可以根据网页历史数据来确定爬虫爬取网页更新信息的周期,大大增加了信息的更新及时性.基于Python3.5定向爬取当当网最新上架图书,存储图书基本信息到Word文档,并且可对比历史爬取记录,更新新书信息.

关 键 词:Python3语言  网络爬虫  定向爬虫  主题爬虫
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号