首页 | 本学科首页   官方微博 | 高级检索  
     

基于视觉特征的网页最优分割算法
引用本文:李文昊,彭红超,童名文,石俊杰. 基于视觉特征的网页最优分割算法[J]. 计算机科学, 2015, 42(11): 284-287, 309
作者姓名:李文昊  彭红超  童名文  石俊杰
作者单位:华中师范大学教育信息技术学院 武汉430079,华中师范大学教育信息技术学院 武汉430079,华中师范大学教育信息技术学院 武汉430079,解放军63981部队 武汉430311
基金项目:本文受教育部科技发展中心网络时代的科技论文快速共享专项研究资助
摘    要:网页分割技术是实现网页自适应呈现的关键。针对经典的基于视觉的网页分割算法VIPS(Vision-based Page Segmentation Algorithm)分割过碎和半自动的问题,基于图最优划分思想提出了一种新颖的基于视觉的网页最优分割算法VWOS(Vision-based Web Optimal Segmentation)。考虑到视觉特征和网页结构,将网页构造为加权无向连通图,网页分割转化为图的最优划分,基于Kruskal算法并结合网页分割的过程,设计网页分割算法VWOS。实验证明,与VIPS相比,采用VWOS算法分割网页的语义完整性更好,且不需要人工参与。

关 键 词:网页最优分割  网页视觉特征  网页自适应呈现  最优划分
收稿时间:2014-10-08
修稿时间:2015-03-23

Web Page Optimal Segmentation Algorithm Based on Visual Features
LI Wen-hao,PENG Hong-chao,TONG Ming-wen and SHI Jun-jie. Web Page Optimal Segmentation Algorithm Based on Visual Features[J]. Computer Science, 2015, 42(11): 284-287, 309
Authors:LI Wen-hao  PENG Hong-chao  TONG Ming-wen  SHI Jun-jie
Abstract:The Web page segmentation technique is a key point to realize Web page adaptive presentation.To overcome the shortcomings of the classical Web page segmentation algorithm VIPS(Vision-based Page Segmentation Algorithm) including fragmented content and semi-automatic,a novel Web page segmentation VWOS(Vision-based Web Optimal Segmentation) was proposed based on the optimal division of graph.The Web page is constructed as the weighted undirected connected graph from the perspective of visual features and structure of the Web page.Therefore,the problem of Web page segmentation is transformed into the optimal division of graph.VWOS was designed by combining Kruskal algorithm and the process of the Web page segmentation.It was proved by the experimentation that the effect of Web page segmentation produced by VWOS is better than that by VIPS.
Keywords:Web page optimal segmentation  Web page vision features  Web page adaptive presentation  Optimal division
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号