首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
基于Rhino的JavaScript动态页面解析研究与实现   总被引:1,自引:0,他引:1  
面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取.鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案.实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案.  相似文献   

2.
1 引言信息多样性的驱动以及互联网个性化趋势,使得越来越多的动态内容被引入Internet。动态页面的实现主要是通过CGI(Common Gateway Interface)或类CGI程序(如:ASP、JSP、PHP、Perl等服务器端嵌入式脚本)在服务器上根据客户端GET或POST方法发来的消息作为参数,并也可与后台数据库交互,动态生成HTML文档。所以,这些临时自动生成的页面“总是”被浏览器认为是最新的。故此,目前大多数的缓存系统都无法对动态页面进行缓存。然而由于CGI程序本身或其访问的数据库并不总是变化的,因而没有必要每次都要向原始服务器发送请求。  相似文献   

3.
随着web2.0技术的飞速发展,Internet上动态网页的数量越来越多。为当前互联网媒体内容监控工作带来了很大的挑战。基于此,本文扩展了原有互联网媒体内容监控系统的网络爬虫,嵌入了动态页面采集程序,进一步丰富了系统的信息采集来源,为做好互联网媒体内容监控工作打下了良好的基础。  相似文献   

4.
万维网Web是Internet上广泛使用的一种服务,它为因特网用户提供了丰富多样的信息资源。随着Web的发展,初期的静态页面已不能满足用户的需求,活动和动态页面成为Web中不可缺少的内容:本文探讨了在Web应用开发中采用服务器端比较流行的ASP来实现动态页面的方法。  相似文献   

5.
运用XML和XSLT技术实现Web页面的重用   总被引:7,自引:0,他引:7  
李伟  郑宁 《计算机应用》2004,24(3):103-105
从分析页面结构特征入手,运用XML和XSLT技术实现Web页面的重用。该方法用动态XML文件定义页面的组成,用XSLT文件定义页面布局,通过XSLT转化把二者统一起来得到最终的页面。页面布局与页面组成的分离实现了页面布局和页面组成块的重用。  相似文献   

6.
万维网Web是Internet上广泛使用的一种服务,它为因特网用户提供了丰富多样的信息资源。随着Web的发展,初期的静态页面已不能满足用户的需求,活动和动态页面成为Web中不可缺少的内容。本文探讨了在Web应用开发中采用服务器端比较流行的ASP来实现动态页面的方法。  相似文献   

7.
基于XML的Web考试系统的数据传输设计   总被引:2,自引:0,他引:2  
刘畅 《微型电脑应用》2004,20(10):32-34
分析了Web考试系统的特点,指出生成动态Web页面的复杂性。给出用Java Servlet和XML技术实现Web考试系统的数据传输方案,即利用元数据将试卷库的数据自动映射成XML文档,在JSP中用XSLT处理器按试卷样式表将XML文档自动转换成HTML页面,Java Servlet根据组卷参数自动获取考生答题页面上的表单域的值。  相似文献   

8.
动态网页源码安全性研究及实现   总被引:4,自引:0,他引:4  
本文在研究了动态网页源码特性的基础上,针对动态页面的源码安全性特点,设计了在开发动态页面的过程中如何加密源码的方法,即将动态页面编译后要向客户显示的内容保存在相应的字符串变量,将其加密,并自动生成静态文件,最后用页面自动跳转的方法将动态页面跳转到该静态页面,以保护源码的安全.  相似文献   

9.
WEB数据库应用程序安全性设计的一种实现   总被引:8,自引:0,他引:8  
Web应用程序和数据库结合可以创建动态页面,从而建设功能强大的商务网站。但是由于HTTP协议的无记忆性,使得每个Web页面相互独立,页面之间缺少必然的因果关系,可以通过URL跳过某个页面而直接去访问其它页面,使得基于Web应用程序数据访问的安全存在很大问题。文章对此进行了讨论,并给出解决该问题的一种方法,即用户所访问的页面必须经过权限验证页面的认可才能访问,并用程序进行了实现。  相似文献   

10.
研究了从数据密集型Web页面中自动提取结构化数据并形成知识表示系统的问题。基于知识数据库实现动态页面获取,进行预处理后转换为XML文档,采用基于PAT-array的模式发现算法自动发现重复模式,结合基于本体的关键词库自动识别页面数据显示结构模型,利用XML的对象-关系映射技术将数据存入知识数据库,由此实现Web数据自动抽取。同时,利用知识数据库已有知识从互联网抽取新知识,达到知识数据库的自扩展。以交通信息自动抽取及混合交通出行方案生成与表示系统进行的实验表明该系统具有高抽取准确率和良好的适应性。  相似文献   

11.
一种动态网页保护系统的设计与实现   总被引:5,自引:0,他引:5  
随着动态网页技术的应用越来越广泛,有必要对动态网页的保护技术进行研究。本文在讨论了动态网页保护系统和非法用户的概念之后,首次在国内设计开发了一种可行的动态网页保护系统。该系统已获“计算机软件著作权登记”。文中对系统的体系结构、网页脚本保护、数据库保护以及系统的自保护做了详细讨论。文章最后指出了该系统在提高智能性方面需要进一步改进之处。  相似文献   

12.
In addition to conventional information media such as newspaper, radio, and television, modern network media such as e-mail and Web page has become popular means of proliferating information. However, the number of Web page is so large that they need to be managed systematically.Therefore, this work presents a component-based Web page management environment, which: (1) enables high-level modeling capability of Web pages through components, (2) improves maintenance of Web applications, and (3) facilitates the reuse of Web page components.  相似文献   

13.
方宏  吕太之 《计算机工程》2009,35(24):265-267
针对传统搜索引擎难以提取客户端脚本生成信息的问题,结合求职搜索引擎的研发,运用HtmlUnit解析JavaScript动态网页,使用Selenium IDE提取动态元素的XPath,解决传统搜索引擎难以提取客户端动态生成信息的问题。实验结果证明,该技术是行之有效的。  相似文献   

14.
熊忠阳  蔺显强  张玉芳  牙漫 《计算机工程》2013,(12):200-203,210
网页中存在正文信息以及与正文无关的信息,无关信息的存在对Web页面的分类、存储及检索等带来负面的影响。为降低无关信息的影响,从网页的结构特征和文本特征出发,提出一种结合网页结构特征与文本特征的正文提取方法。通过正则表达式去除网页中的无关元素,完成对网页的初次过滤。根据网页的结构特征对网页进行线性分块,依据各个块的文本特征将其区分为链接块与文本块,并利用噪音块连续出现的结果完成对正文部分的定位,得到网页正文信息。实验结果表明,该方法能够快速准确地提取网页的正文内容。  相似文献   

15.
在虚拟网页技术基础上,借鉴模块化程序设计思想,提出了Web页面模块化设计方法。将虚拟网页技术与模块化相结合,可显著改变信息的组织与存储方式,具有支持模块级的网页设计复用、快速重组、扩展与更新等显著特点。  相似文献   

16.
Web页面主题相关性排序算法的研究   总被引:3,自引:0,他引:3       下载免费PDF全文
分析了Web页面主题的分布的特点,对经典的页面排序算法进行了探讨,提出了一种基于内容和超链接分析并结合用户点击行为的相关性排序算法。该算法考虑了超文本标记、锚文本、文本内容等对相关性的影响,引入动态比较矩阵来计算相应的权重系数,能够客观分析网页所包含的主题信息,使检索结果排序更合理。实验表明,该算法能有效提高查准率,较好地解决了主题的漂移现象,且具有较好的性能。  相似文献   

17.
郭庆华  武波 《微机发展》2004,14(1):72-74
开发人员使用JSP技术创建动态页面时,面临内容、逻辑和表现形式不能完全分离的难题,导致难于创建与维护页面、难于分工合作、开发进度缓慢等问题。为了解决这个问题,又涌现出许多新的动态页面开发技术。uiXML就是其中之一,它提供了一套真正实现内容、逻辑和表现形式相分离的机制,并且完全可以替代JSP技术来开发动态网页。文中通过一个页面实例,从构建软件架构与运用设计模式角度研究了它优于JSP的特点,同时简要地说明了如何运用它的这些特点来促进开发团队的分工合作,提高系统的开发效率。  相似文献   

18.
动态网页加速技术   总被引:3,自引:0,他引:3  
综述了动态网页加速技术的最新发展,首先介绍了主动缓存,它通过在代理服务器上运行原始服务器提供的Applets以完成必要的处理,并返回结果给用户而不用连接服务器,接着介绍了服务器加速器,它放置于Web Server前端或内部以加速服务器访问速度,最后重点介绍了一种简单的标记语言ESI(Edge Side Includes),用于定义网页片段,使得在因特网边缘可以动态地组装和分发Web应用。  相似文献   

19.
李文昊  彭红超  童名文  石俊杰 《计算机科学》2015,42(11):284-287, 309
网页分割技术是实现网页自适应呈现的关键。针对经典的基于视觉的网页分割算法VIPS(Vision-based Page Segmentation Algorithm)分割过碎和半自动的问题,基于图最优划分思想提出了一种新颖的基于视觉的网页最优分割算法VWOS(Vision-based Web Optimal Segmentation)。考虑到视觉特征和网页结构,将网页构造为加权无向连通图,网页分割转化为图的最优划分,基于Kruskal算法并结合网页分割的过程,设计网页分割算法VWOS。实验证明,与VIPS相比,采用VWOS算法分割网页的语义完整性更好,且不需要人工参与。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号