JavaScript引擎在动态网页采集技术中的应用 Extracting Dynamic URLs Using JavaScript Engine期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

JavaScript引擎在动态网页采集技术中的应用

引用本文：	王映,于满泉,李盛韬,王斌,余智华. JavaScript引擎在动态网页采集技术中的应用[J]. 计算机应用, 2004, 24(2): 33-36

作者姓名：	王映于满泉李盛韬王斌余智华

作者单位：	中国科学院,计算技术研究所,软件研究室,北京,100080;中国科学院,研究生院,北京,100039;中国科学院,计算技术研究所,软件研究室,北京,100080

基金项目：	国家973规划资助项目(G1998030413)，中科院计算所领域前沿青年基金资助项目(20016280-8)

摘要：	怎样提取网页中由JavaScript脚本动态生成的URL，一直是网页采集器设计的一个难题，文中给出了一个基于JavaScript引擎的通用的解决办法和模块实现以及测试结果。
关键词：	网页采集 JavaScript引擎 URL提取 SpiderMonkey
文章编号：	1001-9081(2004)02-0033-04
Extracting Dynamic URLs Using JavaScript Engine

WANG Ying. Extracting Dynamic URLs Using JavaScript Engine[J]. Journal of Computer Applications, 2004, 24(2): 33-36

Authors:	WANG Ying

Abstract:	How to extract URLs that are dynamically created by JavaScript code in web pages? This paper presents a general solution exploiting a JavaScript engine named SpiderMonkey. This paper also describes its module implementation and gives some experimental results.

Keywords:	web retrieval JavaScript engine URL extraction SpiderMonkey
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏