首页 | 本学科首页   官方微博 | 高级检索  
     

JavaScript引擎在动态网页采集技术中的应用
引用本文:王映,于满泉,李盛韬,王斌,余智华. JavaScript引擎在动态网页采集技术中的应用[J]. 计算机应用, 2004, 24(2): 33-36
作者姓名:王映  于满泉  李盛韬  王斌  余智华
作者单位:中国科学院,计算技术研究所,软件研究室,北京,100080;中国科学院,研究生院,北京,100039;中国科学院,计算技术研究所,软件研究室,北京,100080
基金项目:国家973规划资助项目(G1998030413),中科院计算所领域前沿青年基金资助项目(20016280-8)
摘    要:怎样提取网页中由JavaScript脚本动态生成的URL,一直是网页采集器设计的一个难题,文中给出了一个基于JavaScript引擎的通用的解决办法和模块实现以及测试结果。

关 键 词:网页采集  JavaScript引擎  URL提取  SpiderMonkey
文章编号:1001-9081(2004)02-0033-04

Extracting Dynamic URLs Using JavaScript Engine
WANG Ying. Extracting Dynamic URLs Using JavaScript Engine[J]. Journal of Computer Applications, 2004, 24(2): 33-36
Authors:WANG Ying
Abstract:How to extract URLs that are dynamically created by JavaScript code in web pages? This paper presents a general solution exploiting a JavaScript engine named SpiderMonkey. This paper also describes its module implementation and gives some experimental results.
Keywords:web retrieval  JavaScript engine  URL extraction  SpiderMonkey  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号