首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于综合特征的网页类型识别方法
引用本文:陈翰,周杰,李弼程. 一种基于综合特征的网页类型识别方法[J]. 信息工程大学学报, 2011, 0(6): 738-744
作者姓名:陈翰  周杰  李弼程
作者单位:信息工程大学信息工程学院;
基金项目:国家863计划资助项目(2007AA01Z439); 国家社科基金资助项目(09&ZD014)
摘    要:现有网络舆情监测分析系统大多采用人工建立模型、网页逐个匹配的方法识别网页类型,不仅费时费力,而且随着网页的变化和快速增长,效率不断下降,如何让机器快速准确识别出网页类型成为迫切需要解决的问题.针对现有网页分类算法无法自动识别网页所属网络舆情载体类型的问题,深入研究了网页的超链接特征、内容特征和结构特征,构建了面向网络舆...

关 键 词:网页类型  特征提取  自动识别

Genre Recognition Method of Web Pages Based on Integral Features
CHEN Han,ZHOU Jie,LI Bi-cheng. Genre Recognition Method of Web Pages Based on Integral Features[J]. , 2011, 0(6): 738-744
Authors:CHEN Han  ZHOU Jie  LI Bi-cheng
Affiliation:CHEN Han,ZHOU Jie,LI Bi-cheng(Institute of Information Engineering,Information Engineering University,Zhengzhou 450002,China)
Abstract:Extensive human efforts are required to build templates in genre recognition of web pages in present monitoring and analyzing system for network public opinions.As the Web changes and continues to grow,this manual approach becomes less effective,and how to recognize the genre of Web pages accurately and rapidly has become a crucial problem.To solve this problem,a feature set for Web pages automatic recognition is proposed,which is based on research of the hyperlink features,content features and structure fe...
Keywords:Web genre  feature selection  automatic recognition  
本文献已被 CNKI 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号