首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于Ajax的爬虫模型的设计与实现
引用本文:范轩苗,郑宁,范渊. 一种基于Ajax的爬虫模型的设计与实现[J]. 计算机应用与软件, 2010, 27(1): 96-99
作者姓名:范轩苗  郑宁  范渊
作者单位:1. 杭州电子科技大学计算机学院,浙江,杭州,310018
2. 杭州亚龙信息科技有限公司,浙江,杭州,310035
基金项目:浙江省自然科学基金(Y106176)
摘    要:Ajax技术给传统的爬虫带来了巨大的挑战,为了能够提取出在Ajax程序中隐藏的WEB资源,需要解决两大关键问题:JavaScript脚本解析和每一次脚本事件触发后的页面状态信息的保存。提出一种适合Ajax的爬虫模型,在模型中设计了一个嵌入的脚本解析引擎和使用了有向状态图,有效地解决了上述的两个关键问题。实验结果显示该爬虫模型能够有效地提取出Ajax程序中的隐藏资源。

关 键 词:爬虫  脚本解析引擎  有向状态图

DESIGN AND IMPLEMENTATION OF A CRAWLER MODEL BASED ON AJAX
Fan Xuanmiao,Zheng Ning,Fan Yuan. DESIGN AND IMPLEMENTATION OF A CRAWLER MODEL BASED ON AJAX[J]. Computer Applications and Software, 2010, 27(1): 96-99
Authors:Fan Xuanmiao  Zheng Ning  Fan Yuan
Affiliation:School of Computer/a>;Hangzhou Dianzi University/a>;Hangzhou 310018/a>;Zhejiang/a>;China;Hangzhou DBAppsecurity Information Technology CO./a>;LTD/a>;Hangzhou 310035/a>;China
Abstract:
Keywords:Crawler Script-parsing engine Directed status graphics  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号