首页 | 本学科首页   官方微博 | 高级检索  
     

深层网站Ajax页面数据采集研究综述
引用本文:杨俊峰,黎建辉,杨风雷. 深层网站Ajax页面数据采集研究综述[J]. 计算机应用研究, 2013, 30(6): 1606-1610
作者姓名:杨俊峰  黎建辉  杨风雷
作者单位:中国科学院计算机网络信息中心,北京,100190
基金项目:中国科学院“十二五”信息化建设专项基金资助项目(Y107041108); 中国科学院计算机网络信息中心主任基金资助项目(Y013041108)
摘    要:如果能够提高网络爬虫采集Ajax网页数据的能力, 必然会提高搜索引擎的覆盖率和准确率。因此, 深层网站Ajax页面数据采集成为当前网络爬虫技术研究的热点之一。从深层网站Ajax页面数据采集的研究目标、近年来国内外采取的研究方法和取得的成果(研究领域、采集流程、支撑技术)、未来的研究方向三个方面进行了综述。

关 键 词:Ajax  深层网  Web 2. 0  数据采集

Survey on research of data collection fromsupporting Ajax technology deep Web sites
YANG Jun-feng,LI Jian-hui,YANG Feng-lei. Survey on research of data collection fromsupporting Ajax technology deep Web sites[J]. Application Research of Computers, 2013, 30(6): 1606-1610
Authors:YANG Jun-feng  LI Jian-hui  YANG Feng-lei
Affiliation:Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China
Abstract:If researchers can improve the ability of data collection from supporting Ajax technology deep Web sites, it is bound to improve the coverage and accuracy of search engine. Therefore, data acquisition from deep Web sites supporting Ajax technology is becoming one of the hot spots of current Web crawler technology. This paper first elaborated the research target of data collection from supporting Ajax technology deep Web sites, then introduced the recent advances achieved and research methods used at home and abroad, including the field of research, data collection process flow and the relevant supporting technology. At last, it discussed the new research trends.
Keywords:Ajax   deep Web   Web 2. 0   data collection
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号