首页 | 本学科首页   官方微博 | 高级检索  
     

网页区域分割与识别技术
引用本文:吴鹏飞,孟祥增,刘俊晓,马凤娟.网页区域分割与识别技术[J].现代计算机,2006(6):48-50,60.
作者姓名:吴鹏飞  孟祥增  刘俊晓  马凤娟
作者单位:山东师范大学传播学院,济南250014
基金项目:教育部科学技术研究项目
摘    要:结合HTML网页内部特征与外部的结构布局,提出采用映射表这种网页映射模式对网页视图进行变换,基于结构与启发式规则对网页进行区域分割与识别,从而准确得到具有网页各区域的内容.实验结果表明,此方法对各种复杂结构的网页区域分割与识别较为理想.

关 键 词:映射表  启发式规则  区域分割  区域识别
收稿时间:2006-03-27
修稿时间:2006-03-27

Segmentation and Identification of Web Page's Areas
WU Peng-fei,MENG Xiang-zheng,LIU Jun-xiao,MA Feng-juan.Segmentation and Identification of Web Page''''s Areas[J].Modem Computer,2006(6):48-50,60.
Authors:WU Peng-fei  MENG Xiang-zheng  LIU Jun-xiao  MA Feng-juan
Affiliation:School of Communication, Shandong Normal University, Jinan 250014 China
Abstract:Combining the Web page's internal features and external structural layout, mapping table is suggested to tansform the view of Web page. The approach gets every area exactly, through Web page's segmentation and the identification based on the structure and revelatory rules. Experimental results show that this method of complex structure Web page's segmentation and identification extraction is ideal.
Keywords:HTML
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号