共查询到18条相似文献,搜索用时 890 毫秒
1.
基于JavaScript 切片的AJAX 框架网络爬虫技术研究 总被引:1,自引:0,他引:1
自Jesse James Garrett 提出了AJAX 概念以来,由于AJAX 在提升用户交互体验的同时,又不需要在客户端安装插件。因此,一经提出就引起了互联网领域的广泛关注。但目前的网络爬虫技术在AJAX框架的URL 解析过程中存在着不能够识别事件触发顺序等问题,导致大量数据不能被搜索引擎有效检索。本文针对此问题,通过研究基于对象的程序切片算法,以及脚本执行引擎与切片模块的互操作,最终解决AJAX 框架中URL 提取以及异步JavaScript 网络爬虫系统的关键技术问题。 相似文献
2.
3.
一种网络爬虫的带缓存非阻塞异步域名解析器模型及其性能分析 总被引:1,自引:0,他引:1
网络爬虫是搜索引擎的一个基本组件,网络爬虫抓取页面的效率直接影响搜索引擎提供的服务质量。除了可以通过改进网络爬虫的爬行策略来提高网络爬虫效率之外,也可以通过优化网络爬虫程序某方面的设计来消除特定的效率瓶颈。通过对网络爬虫结构和实际运行数据的分析,针对爬虫的DNS解析瓶颈,设计了一种带缓存异步域名解析器模型,并通过实验和一般DNS解析器模型进行了比较,实验结果证明这种模型对于减少程序等待解析域名的这一操作时间十分有效,显然也能够提高爬虫的整体效率。 相似文献
4.
5.
6.
目前传统爬虫无法爬取Ajax动态网站,为解决该问题,该文设计了一个支持Ajax的网络爬虫,提出了AjaxCrawler的体系结构,实现了浏览器、模拟器、控制器和自动机,并通过实验,进行了爬取结果的对比,证明了其效果。 相似文献
7.
8.
随着互联网的迅速发展,网络资源日益丰富,如何从Web尤其是Deep Web中获取信息成为人们关注的焦点,以Ajax为基础的新一代网页信息抓取问题也逐渐成为研究热点。通过分析支持Ajax的Deep Web爬虫关键技术,提出了支持Ajax的Deep Web爬虫的体系结构,阐述了一种自动爬行Ajax网站的算法,为该爬虫的总体框架设计奠定了基础。 相似文献
9.
在研究了现存的主题爬虫的基础上,提出了一种基于统计模型的主题爬虫,它对抓取过程中可获得的信息进行分析,并运用统计模型计算的结果过滤URL,有效地解决了偏好特定主题的用户检索和Web信息的索引等相关问题.实验结果表明,与基于链接和网页内容分析的主题爬虫相比,该主题爬虫能够在检索较少的网页时,抓取到较多的与主题相关的网页,提高了抓取精度. 相似文献
10.
龙文颂 《数字社区&智能家居》2014,(18):4151-4154
Windows脚本程序能够在Windows系统环境下快速地完成机房软件的安装与部署,为机房维护与管理节省大量的人力和财力资源。该文设计了Windows脚本执行流程图,分别实现了读取主机名、修改UGS配置文件、修改UGS环境变量、读取MAC地址、修改ProE配置文件、重启计算机和删除脚本程序等七个功能模块。实践证明,采用Windows脚本程序,能够快速解决软件的批量安装与配置问题。 相似文献
11.
12.
13.
14.
基于总线模型和Json的Ajax安全开发模型 总被引:2,自引:1,他引:1
针对Ajax开发中可能出现的安全问题,提出了一种安全开发模型.该模型基于总线模型实现,能够在单一的点上进行安全策略控制;数据传输使用Json协议,这在Ajax中能够提供高灵活性和高效率的数据传输;安全策略文件使用XML,易于理解和维护,只需妥善编辑这个安全策略文件,便能够对整个应用程序提供完善的安全保护. 相似文献
15.
Ajax技术在深层网(Deep Web)网站开发中得到了广泛应用。针对Ajax页面多状态、状态之间强关联的特性,提出一种构建WSFT(带权状态融合树)模型的方法,来进行Ajax页面文本信息预处理。引入了文本特征树作为状态指纹进行状态捕获,优化了当前Ajax页面数据采集方法,同时通过StatusRank方法计算状态转移权值来分析状态迁移信息,最后生成WSFT。实验证明,该方法能有效地获取Ajax页面多状态文本信息,并且有助于后续Web挖掘的重要文本内容提取。 相似文献
16.
AJAX 应用的典型设计模式 总被引:5,自引:2,他引:3
AJAX是WEB领域的前沿技术,它提供了新的互联网交互模型,扩展了WEB应用的能力。文章对比分析了AJAX工作模式与传统WEB工作模式的主要区别,提出了动态加载、预见式缓存、内容分块三个典型的AJAX应用设计模式,并较为深入地分析了各个模式的设计原理,展示了相关的实例代码。 相似文献
17.
随着Web2.0的兴起,AJAX技术已日益运用到Web应用程序的开发当中。Ajax(Asynchronous JavaScript and XML),即异步调用JavaScript和XML,是一项集客户端与服务器端为一体的技术,它的运用可以大大改善WEB应用程序的用户体验,改变了程序的运行方式。在WEB应用程序中运用缓存,是提高WEB应用程序流畅性,减少网络负载最有效的方法。但直接运用浏览器的缓存,有着明显的缺陷。在深入探讨和分析的基础上,提出用基于的验证模型来实现缓存方法。 相似文献
18.
介绍了Ajax技术的特点和实现过程.阐述了社区警务管理系统的基本概况以及在传统Web应用模型中存在的主要问题,设计实现了基于Ajax异步数据交互的社区警务管理系统,重点介绍了社区警务管理系统的系统结构和关键技术. 相似文献