首页 | 本学科首页   官方微博 | 高级检索  
     

基于规则的网页分割预处理算法研究
引用本文:彭红超,童名文,邹军华,郝秋红.基于规则的网页分割预处理算法研究[J].计算机科学,2013,40(Z11):379-382,388.
作者姓名:彭红超  童名文  邹军华  郝秋红
作者单位:华中师范大学信息与新闻传播学院 武汉430079;华中师范大学信息与新闻传播学院 武汉430079;湖北大学教育学院 武汉430070;华中师范大学信息与新闻传播学院 武汉430079
基金项目:本文受教育部人文社科基金项目:移动学习服务适配决策技术及优化策略研究(10YJC880113),国家科技支撑计划课题:全媒体在线编辑与适配推送数字出版技术研究及应用示范(2013BAH30F01),中央高校基本科研业务费项目:泛在多媒体服务中内容适配决策模型及优化研究,中央高校基本科研业务费项目:数字化学习环境及工具的典型应用(CCNU10C01003)资助
摘    要:针对国家精品课程网站中网页内容和样式独立设计,网页分割算法难以运行的问题,基于规则提出了一种网页分割预处理算法,建立了网页标签和样式信息的关联。算法包括3个步骤:第一,获取样式信息;第二,关联样式信息和标签;第三,输出HTML和PerfectNode关联类列表。随机选取了100个国家精品课程网站的网页运行预处理算法,实验结果表明该算法可以有效地 融合 网页标签和样式信息,解决了网页分割算法无法运行的问题。

关 键 词:网页分割  预处理算法  级联样式表  样式信息

Rule-based Preprocessing Algorithm for Web Page Segmentation
PENG Hong-chao,TONG Ming-wen,ZOU Jun-hua and HAO Qiu-hong.Rule-based Preprocessing Algorithm for Web Page Segmentation[J].Computer Science,2013,40(Z11):379-382,388.
Authors:PENG Hong-chao  TONG Ming-wen  ZOU Jun-hua and HAO Qiu-hong
Affiliation:College of Information Technology,Journalism and Communications,Central China Normal University,Wuhan 430079,China;College of Information Technology,Journalism and Communications,Central China Normal University,Wuhan 430079,China;Faculty of Education,Hubei University,Wuhan 430070,China;College of Information Technology,Journalism and Communications,Central China Normal University,Wuhan 430079,China
Abstract:
Keywords:Web page segmentation  Preprocessing algorithm  Cascading style sheets  Style information
点击此处可从《计算机科学》浏览原始摘要信息
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号