首页 | 本学科首页   官方微博 | 高级检索  
     

面向分类的网页主题特征提取*
引用本文:刘建,孙鹏,倪宏.面向分类的网页主题特征提取*[J].计算机应用研究,2010,27(9):3399-3402.
作者姓名:刘建  孙鹏  倪宏
作者单位:1. 中国科学院研究生院,北京,100049;中国科学院,声学研究所,国家网络新媒体工程技术研究中心,北京,100190
2. 中国科学院,声学研究所,国家网络新媒体工程技术研究中心,北京,100190
基金项目:国家科技支撑计划课题(2008BAH28B04)
摘    要:提出一种基于页面空间特征、视觉特征和内容特征的主题相关性判别方法,通过主题相关度大小量化描述不同内容的重要性,并采用混合加权方法从主题相关节点中提取网页的主题特征。分类实验结果表明,相比传统的FullDoc全文分类,基于此方法提取的主题特征具有更好的分类效果。

关 键 词:网页分类    主题特征    主题相关性

Web-page topical feature extraction for Web-page classification
LIU Jian,SUN Peng,NI Hong.Web-page topical feature extraction for Web-page classification[J].Application Research of Computers,2010,27(9):3399-3402.
Authors:LIU Jian  SUN Peng  NI Hong
Abstract:This paper presented a method that identifies the topical correlativity of one node based on the spatial features, vi-sual features and content features of the page, quantitatively described the different degree of importance of the content, and extracted the topical features through the hybrid weighting method. Experimental results show that Web-page classification based on the extracted page features has better effect compared to the traditional FullDoc text classification.
Keywords:Webpage classification  topical features  topical correlativity
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号