首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
有很多不同的分块算法都可以对web网页进行分块.研究分块的1/1的是为了相关领域进一步研究的需要。例如通过页面块内容的重要程度研究基于块的搜索、定位网页的重要主题或内容,研究网页主要内容或主题的抽取,以及基于Web页面分块的Web存档等。首先给出Web页面分块问题定义和分类,并对几种典型的分块算法进行原理剖析,为进一步研究web页面分块问题提供一些有益的参考。  相似文献   

2.
随着通信技术的发展,人们迫切希望能方便地利用手持移动设备访问Web网站,由于移动设备的小屏幕和低带宽的缺点,使得这一难题一直没有得到很好的解决.本文提出一种适合于移动设备小屏幕的Web页面分块算法,算法利用Web网页上对象的位置信息对信息块进行逐层聚类,生成一棵网页分块树,再根据移动设备屏幕的特点把网页分块树转换成适合小屏幕浏览的页面.  相似文献   

3.
网页分块方法使得Web信息抽取的单位由页面缩小为块.文中研究了网页分块的主要方法与基于学习的分块重要性模型,对Xpath的Web抽取方法进行分析.结合两者的优势提出一种基于分块重要性模型与Xpath结合的Web信息抽取方法,探讨了其设计过程,并给出形式化描述与实验结果,结果表明该方法适合于抽取多记录型的网页.  相似文献   

4.
基于分块的网页正文信息提取算法研究   总被引:6,自引:0,他引:6  
提出并实现了一种从Web页面获取正文的方法。该方法包括2个步骤:网页分块和对内容块的取舍。网页分块采用了一种自底向上分析标签树的自动分块算法,该算法比起以往方法更准确,并且对于复杂结构的页面分块效果更好。通过引入块的重要度和块特征分析每个内容块,来辨别出含有正文的内容块。实验结果表明本方法切实可行并且具有较高的准确性。  相似文献   

5.
基于视觉的Web 页面分块算法的改进与实现   总被引:2,自引:0,他引:2  
基于视觉的Web 页面分块算法(Vision-based Page Segmentation Algorithm)作为网页分块技术重要的一部分,得到了广泛的应用,然而由于网页视觉特点的复杂性,导致VIPS 具有算法规则过于复杂和性能相对不高等缺陷。针对存在的问题,本文用标签树对微软提出的VIPS 进行改进,提出一种改进算法CTVPS,最后通过实验证明了本文算法的正确性和性能优越性。  相似文献   

6.
PageRank算法对页面评价太过客观,对不同重要程度的网页被授予相同的权重,并且在排序时,一些旧的页面经常出现在Web检索结果的前面,而新加入的高质量页面用户很难找到.针对Pagerank算法存在的这些缺陷,引入时间维加权概念,开发出TimedWPR算法,同时保证了两种页面的排序优化.该算法采用服务器反馈回来的网页修改时间表示网页年龄,并在此基础上对网络的组织结构和链接质量以及时间序列进行挖掘,从而克服现有Web超链接分析中的不足.  相似文献   

7.
基于页面结构的信息提取是Web数据挖掘中三大研究领域之一。该研究的关键技术是如何识别Web页面的组织形式,从中挖掘所需要的页面信息。文中基于页面的语义分块(Block)给出一个新的块主题提取算法,与传统的以页面为单位的Web信息提取相比,更符合实际情况,粒度优势明显。该算法针对页面中不同分块的重要性给予不同的权值,依据权值大小取舍页面信息提供给用户。针对该算法进行了模拟实验,从实验结果可以看出该算法具有一定的实用性和有效性。  相似文献   

8.
基于页面结构的信息提取是Web数据挖掘中三大研究领域之一。该研究的关键技术是如何识别Web页面的组织形式,从中挖掘所需要的页面信息。文中基于页面的语义分块(Block)给出一个新的块主题提取算法,与传统的以页面为单位的Web信息提取相比,更符合实际情况,粒度优势明显。该算法针对页面中不同分块的重要性给予不同的权值,依据权值大小取舍页面信息提供给用户。针对该算法进行了模拟实验,从实验结果可以看出该算法具有一定的实用性和有效性。  相似文献   

9.
图像搜索中基于网页分块的图像分类研究   总被引:1,自引:0,他引:1       下载免费PDF全文
本文提出并实现了一种基于网页分块的图像分类模型,利用图像位于网页中的特点,将图像和网页结构有效地结合起来对网络环境中的图像进行分类。首先利用VIPS页面分块算法对网页进行分块,然后根据分块网页结构的特点将各分块网页中的图像分为背景类、广告类和主题类,最后利用这个图像分类结果指导网络环境下的图像搜索。实验结果表明明,这种方法能够显著提高图像搜索性能。  相似文献   

10.
加速评估算法:一种提高Web结构挖掘质量的新方法   总被引:13,自引:1,他引:13  
利用Web结构挖掘可以找到Web上的高质量网页,它大大地提高了搜索引擎的检索精度,目前的Web结构挖掘算法是通过统计链接到每个页面的超链接的数量和源结点的质量对页面进行评估,基于统计链接数目的算法存在一个严重缺陷:页面评价两极分化,一些传统的高质量页面经常出现在Web检索结果的前面,而Web上新加入的高质量页面很难被用户找到,提出了加速评估算法以克服现有Web超链接分析中的不足,并通过搜索引擎平台对算法进行了测试和验证。  相似文献   

11.
结合网站内容和结构进行的Web日志挖掘   总被引:7,自引:1,他引:7  
提出一种以聚类为基础的Web日志挖掘方法:从Web日志事务、Web站点内容和Web站点结构3个不同方面来聚类页面集合,并通过将用户的访问记录和页面聚集进行匹配和相关度计算,来预测用户感兴趣的页面。  相似文献   

12.
This paper examines the evolution of the World Wide Web as a network of networks and discusses the emergence of Web Science as an interdisciplinary area that can provide us with insights on how the Web developed, and how it has affected and is affected by society. Through its different stages of evolution, the Web has gradually changed from a technological network of documents to a network where documents, data, people and organisations are interlinked in various and often unexpected ways. It has developed from a technological artefact separate from people to an integral part of human activity that is having an increasingly significant impact on the world. This paper outlines the lessons from this retrospective examination of the evolution of the Web, presents the main outcomes of Web Science activities and discusses directions along which future developments could be anticipated.  相似文献   

13.
14.
15.
文章首先阐述了Web3.0的发展趋势,然后通过分析国内Web3.0网站,描述了Web3.0技术特性,最后提出了用户在Web3.0网站的搭建个人网站的方法。  相似文献   

16.
为了更好地构建易编写、结构清晰、可扩展的Web应用系统,人们提出了大量的Web框架,其中最具代表性的就是Struts。在一定程度上,Web框架达到了这一要求。文中对Struts作了简单的分析和介绍;再结合具体的Web应用要求,以面向对象的设计方法和设计模式的思想为指导,根据这些具体应用的要求和特点扩展了Struts框架。扩展后的框架较好的实现了模式一视图一控制器中的控制器层,同时也解决了一些实际的Web应用系统中的常见的如权限验证、日志记录等问题。  相似文献   

17.
一种新型的传感器WEB标准-传感器WEB整合框架   总被引:2,自引:0,他引:2  
传感器网络有着广阔的应用前景,是目前的研究热点之一.但是由于传感器网络的异构性,将它们互联在一起,达到资源有效分配、共享的目的比较困难.SWE提出了解决该问题的有效方法,并且成为了事实上的工业标准.本文分析了SWE的产生背景,阐述了SWE的组件和体系结构,重点讨论了SWE的信息模型,分析和总结了SWE的重点研究问题以及关键技术的解决思路,介绍了两个典型的研究实例.  相似文献   

18.
为了更好地构建易编写、结构清晰、可扩展的Web应用系统,人们提出了大量的Web框架,其中最具代表性的就是Struts.在一定程度上,Web框架达到了这一要求.文中对Struts作了简单的分析和介绍;再结合具体的Web应用要求,以面向对象的设计方法和设计模式的思想为指导,根据这些具体应用的要求和特点扩展了Struts框架.扩展后的框架较好的实现了模式-视图-控制器中的控制器层,同时也解决了一些实际的Web应用系统中的常见的如权限验证、日志记录等问题.  相似文献   

19.
Web Service技术由于其特点和优势,在分布式计算中占有重要地位.本文首先简要描述了跨域不同Web站点一次登录的需求,随后简单介绍了Web Service的原理,最后说明了应用Web Service技术解决一次登录的技术方法.  相似文献   

20.
Web Services与传统Web应用   总被引:4,自引:3,他引:4  
本文针对Web Services技术实质以及与传统Web应用区别,分别从技术、商务价值和编程实现上进行了比较研究,展现了Web Services的独特之处与应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号