首页 | 本学科首页   官方微博 | 高级检索  
     

基于Rhino的JavaScript动态页面解析研究与实现
引用本文:金晓鸥,钟宝燕,李翔.基于Rhino的JavaScript动态页面解析研究与实现[J].计算机技术与发展,2008,18(2):1-4,50.
作者姓名:金晓鸥  钟宝燕  李翔
作者单位:上海交通大学信息安全工程学院,上海,200240
基金项目:国家自然科学基金 , 上海市科委科技计划 , 教育部跨世纪优秀人才培养计划
摘    要:面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取.鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案.实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案.

关 键 词:脚本解释引擎Rhino  JavaScript  动态页面  动态页面解析  Rhino  JavaScript  动态页面  解析研究  Engine  Based  Dynamic  Web  Page  Implementation  内容提取  主体  网页  递归  网络地址  超链接  数据源对象  整体方案  结果  实验  页面解析  信息获取
文章编号:1673-629X(2008)02-0001-04
收稿时间:2007-05-03

Research and Implementation of Interpreting JavaScript Dynamic Web Page Based on Rhino Engine
JIN Xiao-ou,ZHONG Bao-yan,LI Xiang.Research and Implementation of Interpreting JavaScript Dynamic Web Page Based on Rhino Engine[J].Computer Technology and Development,2008,18(2):1-4,50.
Authors:JIN Xiao-ou  ZHONG Bao-yan  LI Xiang
Abstract:Dynamlc Web page holds more than 50% of the total Web pages in countywide;however,the information collector of current network public opinion monitoring system can not get the information of Internet medium which uses dynamic Web page as its main content distribution form. Thereby,there is a scheme for interpreting JavaScript dynamic Web page by using Rhino engine presented in this psper. Proved by the experiments, this scheme is an effective one for extracting the hyperlink network addresses and content of dynamic Web page and it has enriched the work data set of network public opinion monitoring.
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号