首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
正则表达式是一种用于字符串模式匹配和替换的强有力工具。介绍了在vc++中如何配置Boost.Regex,实现基于正则表达式网页信息抽取类CHtmlcodelE.从而完成了网页信息高效抽取。  相似文献   

2.
摈弃了传统网页清洗算法实现繁琐、效率低下、准确丰差等种种弊端,分析了当前网页的代码结构,提出了基于正则表达式的信息筛选、滤除算法,并在Visual Studio.NET 2003环境下结合Kegex类、MatchCollection类、Match类,用C#语言实现了该算法.  相似文献   

3.
随着互联网的发展及经济利益的驱动,黑客已将攻击重点转到web应用服务器上,由此危害了服务器安全及客户端安全。针对这一现状,文章首先采用广度优先算法实现网络爬虫来获取目标网站的架构信息;然后用网页动态参数判定、网站架构分析、信息智能识别等技术对网站安全进行辅助检测,用正则表达式过滤非法跨站请求,实现跨站脚本攻击检测;最后,用正则表达式和Python强大的库资源编程实现了应用安全的实时检测和评估功能。实验表明:该系统在一定程度上减少了Web恶意攻击行为所带来的损失,提高了应对网页信息安全突发事件的响应速度。  相似文献   

4.
马冬雪  宋设  谢振平  刘渊 《计算机应用》2020,40(6):1574-1579
针对正则表达式解析招投标网页效率低下的问题,提出了一种基于招投标领域本体的网页自动化解析新方法。首先,分析了招投标网页文本的结构特征;其次,构建了招投标本体的轻量级领域知识模型;最后,给出一种招投标网页元素语义匹配与抽取算法,实现招投标网页的自动化解析。实验结果表明,新方法通过自适应的解析,准确率、召回率分别可达到95.33%、88.29%,与正则表达式方法相比,分别提高了3.98个百分点和3.81个百分点。所提方法可实现自适应地对招投标网页中语义信息的结构化解析抽取,能够较好地满足实用性能要求。  相似文献   

5.
分析了嵌入式框架在实际应用中存在的不足,设计并实现了一种基于正则表达式的抓取网页源码方法。并在asp.net 环境下,用C#语言实现了该方法。这种方法有生成页面简单、快速的优点,提高了网页的可读性、安全性,生成的页面也更利于设计者使用。  相似文献   

6.
本文通过 Web网页编程实例,介绍在微软 VisualJ++ 6. 0版集成开发平台中设计 Web主页时的 DHTML技术的应用、实现机制和编程要点。  相似文献   

7.
陆璐  全君林  李玮超 《计算机工程》2010,36(23):113-115,118
设计一个基于客户端的恶意网页收集系统。系统通过设置主题爬虫,有针对性地获取可能包含恶意脚本的网页文件,通过分析恶意代码常见的挂木马方式与恶意代码样本,设计正则表达式来提取网页恶意代码的特征码,利用相应算法扫描并匹配利用爬虫获取的网页文件,如发现网页文件中包含可疑的恶意脚本,则将它的域名URL、恶意网页路径与恶意代码脚本类型存入恶意网页库中,以实现恶意网页的搜集。  相似文献   

8.
随着通用网关接口以及各种脚本编程的兴起,动态网页技术已经取代静态网页成为网站应用的核心技术。 动态网页一方面极大地丰富了互联网信息资源,另一方面也成为各种非法内容流传的载体。本文着重研究针对各种 动态网页实现技术如何有效监控动态网页的内容,以保障Web应用的安全。  相似文献   

9.
随着通用网关接口以及各种脚本编程的兴起,动态网页技术已经取代静态网页成为网站应用的核心技术,动态网页一方面极大地丰富了互联网信息资源,另一方面也成为各种非法内容流传的载体。本文着重研究针对各种动态网页实现技术如何有效监控动态网页的内容,以保障Web应用的安全。  相似文献   

10.
正则表达式在远程网页下载中的应用   总被引:1,自引:0,他引:1  
分析了远程网页的结构特征,阐述了正则表达式在网页下载中的应用,提出了运用正则表达式匹配替换多余HTML源文件和直接在HTML源文件中匹配提取元数据的两种获取远程数据的方法,同时完成了数据解析、提取及保存的整个过程,并将文章所附有的附件、图片及音频等文件下载到本地服务器。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号