一种基于Ajax的爬虫模型的设计与实现 DESIGN AND IMPLEMENTATION OF A CRAWLER MODEL BASED ON AJAX期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种基于Ajax的爬虫模型的设计与实现

引用本文：	范轩苗,郑宁,范渊. 一种基于Ajax的爬虫模型的设计与实现[J]. 计算机应用与软件, 2010, 27(1): 96-99

作者姓名：	范轩苗郑宁范渊

作者单位：	1. 杭州电子科技大学计算机学院,浙江,杭州,310018 2. 杭州亚龙信息科技有限公司,浙江,杭州,310035

基金项目：	浙江省自然科学基金(Y106176)

摘要：	Ajax技术给传统的爬虫带来了巨大的挑战,为了能够提取出在Ajax程序中隐藏的WEB资源,需要解决两大关键问题：JavaScript脚本解析和每一次脚本事件触发后的页面状态信息的保存。提出一种适合Ajax的爬虫模型,在模型中设计了一个嵌入的脚本解析引擎和使用了有向状态图,有效地解决了上述的两个关键问题。实验结果显示该爬虫模型能够有效地提取出Ajax程序中的隐藏资源。
关键词：	爬虫脚本解析引擎有向状态图
DESIGN AND IMPLEMENTATION OF A CRAWLER MODEL BASED ON AJAX

Fan Xuanmiao,Zheng Ning,Fan Yuan. DESIGN AND IMPLEMENTATION OF A CRAWLER MODEL BASED ON AJAX[J]. Computer Applications and Software, 2010, 27(1): 96-99

Authors:	Fan Xuanmiao Zheng Ning Fan Yuan

Affiliation:	School of Computer/a>;Hangzhou Dianzi University/a>;Hangzhou 310018/a>;Zhejiang/a>;China;Hangzhou DBAppsecurity Information Technology CO./a>;LTD/a>;Hangzhou 310035/a>;China

Abstract:

Keywords:	Crawler Script-parsing engine Directed status graphics
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏