首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
动态网页是指网页能依据不同的情况做出动态的响应。在对基于模板的动态网页设计问题进行分析的基础上,使用JSP这种动态网页技术,并使用Struts模板标签,说明模板技术是如何将网页所要实现的功能和网页中的图形、文字等的布局进行分离的,并把模板库思想动态网页相结合,最终将页面按照整体各部分的功能类型分类,总结归纳出多个不同的页面模板,组成一种小型应用系统的常用模板库。  相似文献   

2.
从互联网上挖掘大量双语平行句对,可以快速有效地构建大规模双语资源,服务于统计机器翻译。从挖掘对象的不同,将网络数据源分成对照网页和平行网页两类,提出一种抽取双语句对的方法。首先,从上述两类网页中分别抽取平行文本段,对照网页文本段抽取的主要方法为页面过滤和模板匹配,而平行网页依赖于网页结构的相似,采用对应节点匹配方法;其次,采用Gale-Church算法进行句对齐,得到平行句对;最后统一进行后处理。实验结果表明,从对照网页获取平行句对的准确率达到93.3%,平行网页为93.5%。  相似文献   

3.
Web信息抽取技术一直是信息技术领域的研究热点。而且,近年来,DIV+CSS的网页布局方法开始普遍应用于网页设计中。基于此,提出了一种较为简单和实用的基于正文特征和网页结构的新闻网页正文抽取方法。首先识别和提取网页正文内容块,然后利用正则表达式滤除内容块中的HTML标记并提取网页正文。实验结果表明,该方法对正文抽取具有较高的通用性与准确率。  相似文献   

4.
在信息科技快速发展的今天,网络在信息传递中发挥了不可替代的作用.随着人们审美水平不断提高,网页中的有关动画的设计越来越受到了大众的喜爱,和传统的相对静态的网页相比,用户更青睐于富有动态设计页面,为了能够更有效的利用网络来传递信息,提高网页观赏性和吸引力,动画设计就起到了非常重要的作用.怎样更好的将动画设计应用在网页设计中?本文首先分析网页设计中动画设计创意需要遵从的原则,并对动画设计创意的方法进行归纳总结,希望能够为网页设计者更好的将动画设计应用到网页设计中提供参考.  相似文献   

5.
针对现有现有HTML网页的特点,提出了一种基于标签的Web网页的清洗技术,该方法基于HTML各种标签的特点,对修饰性等与内容无关的标签进行清洗,首先界定清洗的规则,对呵清洗的标签进行定义;然后根据清洗规则对HTML网页进行处理。本论文所提方法没有改变文档的半结构特点,使后续信息的抽取较之未改进有明显的优势。  相似文献   

6.
网页结构化信息抽取技术方法研究   总被引:2,自引:0,他引:2  
分析了两种当前主流的网页结构化信息抽取技术方法:基于模版的分装器方法和不依赖模版的基于视觉的网页信息抽取技术方法,并在此基础上实现了一种新的网页结构化信息抽取算法,一定程度上提高了抽取效率和精度。  相似文献   

7.
网页的内容信息对于提高聚类质量来说并不完全够用,针对网络社区网页之间存在的天然链接关系,本文提出了一种挖掘用户标签的增强型社区网页聚类算法.本文采用多种距离度量方法,并挖掘网页链接关系,然后将网页的内容信息相似度和链接关系结合起来进行聚类.实验表明,提出的算法是有效的.  相似文献   

8.
由于互联网技术高度发展,网页制作技术的运用也越来越广泛。文章主要讨论高职高专的计算机专业如何开设网页制作课程。首先从市场需求、技术发展和课程开设3方面阐述了网页制作的现状.然后明确了课程定位和培养目标,归纳出网页制作课程的教学内容,并且以模块化方式进行了教学内容的划分.最后提出以项目教学法和任务情景驱动模式相结合的教学方法进行教学设计,给出任务情景的具体操作过程,充分体现出网页制作课程以就业岗位为导向和"教学做"一体的课程理念。  相似文献   

9.
甘露  赵娜 《通讯世界》2016,(10):146-147
随着21世纪移动网络化的到来,网页的普遍化发生在每个人的身边,网页的智能化和多样化让人们的生活更加方便.网页设计从一种平面设计的文本信息延伸到视觉与听觉相结合的一种设计,其中网页设计运用了多种计算机多媒体技术,提高了网页页面的可读性.本文主要介绍计算机多媒体技术和网页设计相结合的应用.  相似文献   

10.
伴随着网络的广泛普及,我们已经进入信息化时代.因此,为了让大量信息更好的传播,需要在网站制作上进行精心的设计,让人们更好很好地接受信息.本文主要介绍了利用HTML语言进行网页设计,并分析了其主要特点和优势,结合常用的网页制作技巧进行说明,旨在提高网页制造水平.  相似文献   

11.
To address the problem of extracting valuable information from massive Web pages in big data environments,a novel information extraction method based on node property and text content for massive Web pages was put forward.Web pages were converted into a document object model (DOM) tree,and a pruning and fusion algorithm was introduced to simplify the DOM tree.For each node in the DOM tree,both density property and vision property was defined and Web pages were pretreated based on these property values.A MapReduce framework was employed to realize parallel information extraction from massive Web pages.Simulation and experimental results demonstrate that the proposed extraction method can not only achieve better performance but also have higher scalability compared with other methods.  相似文献   

12.
张智  顾韵华 《信息技术》2011,(5):108-111
针对Deep Web的查询需求,提出了一种基于K-近邻算法的Deep Web数据源的自动分类方法。该算法在对Deep Web网页进行表单特征提取及规范化的基础上,基于距离对Deep Web网页所属的目标主题进行判定。实验结果表明:基于K-近邻分类算法可以较有效地进行DeepWeb数据源的自动分类,并得到较高的查全率和查准率。  相似文献   

13.
Web服务器日志中记录了用户的浏览模式,为了从中提取出具有相似访问模式的用户群,对其提供个性化服务,提出一种针对Web日志的分析方法。通过构建UserID-URL关联矩阵,引入加权关联矩阵,提出一种基于加权矩阵的聚类算法——多标记传播算法。实验表明,该算法在Web日志挖掘中进行用户聚类和页面聚类是高效可靠的。  相似文献   

14.
针对恶意网页的威胁,提出了一种基于社会信任的分布式恶意网页协作防御机制:结合第三方专业服务机构提供的恶意网址列表,并利用社会网络中好友间的直接信任和间接信任获取好友对网页的评价信息,集成好友的安全浏览经验形成网页综合评价;每个用户都与其好友进行协作,形成一个网状的防御体系。实验结果表明,该机制能够有效减少恶意网页的访问量,提高社会网络防御恶意网页的能力。  相似文献   

15.
分布式Web Crawler的研究:结构、算法和策略   总被引:12,自引:0,他引:12       下载免费PDF全文
叶允明  于水  马范援  宋晖  张岭 《电子学报》2002,30(Z1):2008-2011
本文介绍了一个大型分布式Web Crawler系统--Igloo 1.2版.它采用分布式的系统结构,通过我们设计的二级哈希映射算法使系统可以进行高效的任务分割,并且系统的规模动态可扩展.爬行网页的质量是评价Crawler的一个重要指标,Igloo以PageRank值作为网页质量评价的标准,从而提高了爬行质量.加快爬行速度的关键是如何解除Crawler系统中的性能瓶颈,本文对此也作了详细的讨论,并提出了一种基于“滞后合并”策略的UBL数据库存取方法.实验表明,Igloo在保持高性能的同时能快速爬行到高质量的网页.  相似文献   

16.
基于网络用户行为的相关页面挖掘模型   总被引:11,自引:0,他引:11  
文章提出了一种基于网络用户行为的相关页面挖掘模型。模型采用统计的方法对proxy日志进行挖掘。模型的输入是一个WEB页面,输出是一组与之相关的页面。模型的假设基础是一组兴趣相似的人访问的页面有可能相关。模型从用户群中找出对输入页面感兴趣的用户,通过聚类从这些用户中找出一类具有相似兴趣背景且对输入页面最感兴趣的用户,综合这类用户感兴趣的页面,从中挖掘出与输入页面相关的页面。该模型与目前流行的相关页面检索算法的最大区别在于分析的对象是网络用户行为,因为模型认为页面是否相关的最终判定者应该是用户,通过分析网络用户行为能够更好地挖掘用户在页面相关判定上的潜在意识。用户对页面的兴趣度基于用户对页面的访问频率而定义。实验表明,该模型是可行的。该模型可用于改进传统的IR,提供相关反馈和查询扩展,使其更加适应Internet检索。该模型也可用于内容安全方面的相关主题预测。  相似文献   

17.
用户兴趣空间的Web页面聚类   总被引:5,自引:1,他引:4  
文章基于日志挖掘,提出一种在用户兴趣空间中进行Web页面聚类的算法。算法的基础是用户访问频率矩阵A。A的行对应页面向量,列对应用户向量,A中元素是用户对页面的访问频率。对A中的行做聚类可以对页面进行相关聚类,对A中的列做聚类可以对兴趣相似的用户进行聚类。文章认为A中的这两种聚类是一对对偶问题。文章基于A和A中这两种聚类在权重之间的对偶关系,提出了用户兴趣空间的概念。用户兴趣空间突出了用户的共同兴趣,是一个正交空间。实验结果表明,与在A中直接做页面聚类相比较,用户兴趣空间中的页面聚类取得了较好的效果。  相似文献   

18.
基于BP神经网络的Web页面分类算法   总被引:3,自引:0,他引:3  
提出了一种基于BP神经网络的Web页面分类算法。在搜索引擎的结构中提取页面标题、内容标题和内容摘要来表示页面,采用向量空间模型计算分类组合与页面组合的相关性对页面进行矢量化,将训练后的BP神经网络用于对Web页面进行分类。实验结果表明,该分类算法有一定的实用价值。  相似文献   

19.
宋鳌   《电视技术》2011,35(13):44-48,63
提出了一种基于LCS的特征树最大相似性匹配网页去噪算法.通过将目标网页和相似网页转化为特征树,并将特征树映射为一个特征节点序列,利用LCS算法能获得最长子序列全局最优解的特点,找出两棵特征树之间的不同节点作为候选集,并对候选集进行聚集评分找出网页重要内容块.给出了算法的原型系统,并对每一个模块的实现做了详尽的描述.  相似文献   

20.
杨秀萍 《现代电子技术》2006,29(18):42-44,46
Internet的普及使得数据挖掘的重点从经典的基于关系数据库的应用转移到了基于Web的应用。首先介绍了Web挖掘的基本概念及其当前发展的几个方向,然后将一种传统的数据挖掘方法关联规则挖掘应用到Web的海量数据上,并给出了挖掘的基本算法,在此基础上挖掘出新的关联规则及其模式,最后将结果在一些较简单的网页上进行了验证,取得了较好的应用效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号