首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
网页防篡改系统的研究与设计方案   总被引:1,自引:0,他引:1  
随着网站建设的规模化,网站安全问题日益严峻,其中网页篡改尤为严重,因此需要网页防篡改系统的保护。介绍了网页防篡改的三种技术:外挂轮询、核心内嵌和事件触发并对这三种技术进行了比较,然后描述了网页防篡改系统的功能需求以及拓扑结构,分析了基于MD5算法的防篡改原理,最后给出一个网页防篡改系统的设计方案。  相似文献   

2.
随着Internet的迅猛发展,Web上的网页数目呈现指数级的爆炸性增长趋势,在Web上检索及发现有价值的信息已成为了一项重要的任务,"噪音"的出现往往会降低基于页面处理的各种算法的效率。因此,如何删除页面的噪音,提取页面中的主要内容是Web挖掘中的重要问题。给出了抽取网页中各种分类有效的文本的具体实现。  相似文献   

3.
网站文件保护系统的研究与实现   总被引:1,自引:0,他引:1  
网站因需要被公众访问而暴露于因特网上,容易成为黑客的攻击目标,因此需要专门的网站文件保护系统来保障网站内容的安全.分析了网站文件保护系统的模型,对组成模型的3个部分进行了功能说明,然后分析了文件保护的原理,介绍了网站文件保护系统的组成和功能,描述了目前网站文件保护系统使用的3种技术:外挂轮询、核心内嵌、事件触发,并对这3种技术进行了比较.最后给出一个网站文件保护系统的设计方案,并对该方案进行了测试.  相似文献   

4.
通过对现有Web信息抽取方法和当前Web网页特点的分析,发现现有抽取技术存在抽取页面类型固定和抽取结果不准确的问题,为了弥补以上两个不足,文中提出了一种基于页面分类的Web信息抽取方法,此方法能够完成对互联网上主流信息的提取。通过对页面进行分类和对页面主体的提取,分别克服传统方法抽取页面类型固定和抽取结果不够准确的问题。文中设计了一个完整的Web信息抽取模型,并给出了各功能模块的实现方法。该模型包含页面主体提取、页面分类和信息抽取等模块,并利用正则表达式自动生成抽取规则,提高了抽取方法的通用性和准确性。最后用实验证实了文中方法的有效性与正确性。  相似文献   

5.
本文提出并实现了架设在符合J2EE标准的Web服务器上的网页防篡改系统,该系统主要采用Java语言开发和实现,能够对目前各种主流操作系统平台上的网页内容进行实时监控,发现网页被篡改时能及时恢复并报警,有效的保护目标网站的安全。  相似文献   

6.
基于网站结构挖掘的Web文档自动分类   总被引:3,自引:0,他引:3  
对Web文档进行人工分类可以达到准确的分类效果,但需要大量的时间和人力的投入。传统的基于特征向量的分类方法准确性较低,文中提出把挖掘网站的拓扑结构和现有的文档分类方法相结合,并根据扩展网页的特征提取,挖掘出单个网站的分类模式,再将多个网站的分类模式进行综合,生成搜索引擎的分类模式。  相似文献   

7.
随着互联网的快速发展,用户对网页浏览便捷性、美观性的要求越来越高,网页特效也越来越多样化。在各大电商网站中,用户想要查看商品的细节部分,因此需通过“放大镜”的交互效果来展示商品的细节,以此来提高用户的体验。通过JavaScript的offset系列属性来实现发大镜效果。  相似文献   

8.
提出一种利用相邻网页信息修正分类结果的方法。这种方法首先利用NaiveBayes分类器分类待分类网页;其次对待分类网页做链接分析并计算页面与链出页面的相似度,对初始分类结果做修正,得到最终分类结果。根据该方法实现了网页自动分类原型系统,并进行分类实验,实验表明该方法有效提高了分类性能。  相似文献   

9.
讨论若干Deep Web数据库分类准确性的前沿技术,建立基于词频和DOM树的文本特征提取方法模型,提出计算Deep Web数据库的基于权值的K-NN(K Nearest Neighbors)分类优化算法。利用UIUC提供的TEL-8数据集和WEKA平台的各类算法进行实验,并对分类精度、召回率和综合F-measure等测度上的分类结果进行比较。实验结果表明,该方法模型在3个指标上表现都较为突出。  相似文献   

10.
Web页面标注技术在互联网上应用广泛,提出了一种基于JavaScript的新型的标注生成、呈现及存储技术.运用JavaScript脚本语言结合JSP,开发出了可以内嵌于Web页面的组件,使得生成、呈现以及存储标注变得简单、快捷.  相似文献   

11.
一种动态网页保护系统的设计与实现   总被引:1,自引:0,他引:1  
本文提出了网页防篡改系统的组成和功能,描述了网页防篡改中的关键技术,并用简单的VB语言为代表,常见的ASP动态网页为例,提出了解决web网页保护的一个解决方案。  相似文献   

12.
基于RSOM-Bayes的网页分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对向量空间模型的网页分类计算复杂度高、不适用于大规模场景问题,该文采用RSOM和BAYES相结合的方法实现网页分类,利用RSOM 神经网络树实现网页特征词的自动索引,利用Bayes实现网页的自动分类。结果证明其在特征空间维数、检索效率、样本容量及检索精度方面都具有良好的性能。  相似文献   

13.
图像搜索中基于网页分块的图像分类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
本文提出并实现了一种基于网页分块的图像分类模型,利用图像位于网页中的特点,将图像和网页结构有效地结合起来对网络环境中的图像进行分类。首先利用VIPS页面分块算法对网页进行分块,然后根据分块网页结构的特点将各分块网页中的图像分为背景类、广告类和主题类,最后利用这个图像分类结果指导网络环境下的图像搜索。实验结果表明明,这种方法能够显著提高图像搜索性能。  相似文献   

14.
基于支持向量机的中文网页自动分类   总被引:5,自引:0,他引:5  
贾泂  梁久祯 《计算机工程》2005,31(10):145-147
研究了支持向量机在中文网页分类中的应用,给出了基于关键词的中文网页特征提取和选择方法,阐述了统计学习理论中的支持向理机模型及其在分类问题应用中的特点,给出了设计支持向量机分类器的二次规划学习算法。  相似文献   

15.
对于Web内容挖掘来说,对挖掘对象进行初步的识别是非常重要的,首先必须把含有具体内容的网页识别出来,才能进一步进行有效的分析。论文提出了链接比的概念,以此来分析网页的特征,然后进行有监督的学习,从而导出相关的规则,再用该规则对新的网页进行分类。  相似文献   

16.
将文本分类技术应用于林业Web黄页的分类,实现了林业Web黄页信息的高效应用和管理。讨论了林业Web黄页多层次分类体系,并给出了分类系统的设计方案和关键技术,详细介绍了类别区分词特征选择算法。实验结果具有较好的准确率和查全率。  相似文献   

17.
Web网页识别中的特征选择问题研究   总被引:26,自引:0,他引:26  
对Web网页识别中有关特征选择的两个重要问题进行了深入的探讨,提出了一种新的描述特征选择方法,并将其与3种已有的描述特征方法进行实验比较,证实其有效性,此外还对5种在文本归类中,具有代表性的识别特征选择方法在Web网页识别中的实际应用效果进行了评估比较,并发现信息增益和统计方法,选择识别特征效果最佳。  相似文献   

18.
针对已有网页分割方法都基于文档对象模型实现且实现难度较高的问题,提出了一种采用字符串数据模型实现网页分割的新方法。该方法通过机器学习获取网页标题的特征,利用标题实现网页分割。首先,利用网页行块分布函数和网页标题标签学习得到网页标题特征;然后,基于标题将网页分割成内容块;最后,利用块深度对内容块进行合并,完成网页分割。理论分析与实验结果表明,该方法中的算法具有O(n)的时间复杂度和空间复杂度,该方法对于高校门户、博客日志和资源网站等类型的网页具有较好的分割效果,并且可以用于网页信息管理的多种应用中,具有良好的应用前景。  相似文献   

19.
网页分类是为了解决网络信息过载问题而延伸的一个热门研究领域,同时支持向量机以其出色的学习能力,在解决高维问题时表现出了特定的优势。本文在研究支持向量机和标准的免疫克隆优化算法的基础上,提出了一种改进的免疫克隆和支持向量机相结合的分类算法。标准算法中由于通过对抗体编码中某些位进行随机取反来实现抗体变异,造成搜索能力不强。该方法针对上述不足,将记忆单元和普通单元区分开来,对记忆单元定义自适应概率,从而加强在当前最优解邻域内的搜索能力,加快寻求全局最优解的速度。实验结果表明,该改进算法较其他算法具有更好的参数选择效果和更高的选择效率,是一种具有较高准确率和效率的网页分类方法。  相似文献   

20.
基于工作过程系统化的动态网页设计课程重构从学生就业岗位出发,将典型工作任务分析,转换成系列项目课程,通过学习情境的设置使学生掌握设计方法。课程模糊了理论教学与实践教学的界限,除对学生进行专业知识与技能的培训外,更加注重学生组织、合作、自主学习等关键能力的培养,本文对基于工作过程的课程重构进行了初步的探索。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号