首页 | 官方网站   微博 | 高级检索  
     

一种基于预分类的高效SVM中文网页分类器
引用本文:许世明,武波,马翠,邸思,徐洪奎,杜如虚.一种基于预分类的高效SVM中文网页分类器[J].计算机工程与应用,2010,46(1):125-128.
作者姓名:许世明  武波  马翠  邸思  徐洪奎  杜如虚
作者单位:1. 西安电子科技大学计算机学院,西安,710071;中国科学院深圳先进技术研究院,广东,深圳,518067
2. 西安电子科技大学计算机学院,西安,710071
3. 中国科学院深圳先进技术研究院,广东,深圳,518067
摘    要:中文网页分类技术是数据挖掘研究中的一个热点领域,而支持向量机(SVM)是一种高效的分类识别方法。首先给出了一个基于SVM的中文网页自动分类系统模型,详细介绍了分类过程中涉及的一些关键技术,其中包括网页预处理、特征选择和特征权重计算等。提出了一种利用预置关键词表进行预分类的方法,并详细说明了该方法的原理与实现。实验结果表明,该方法与单独使用SVM分类器相比,不仅大大减少了分类时间,准确率和召回率也明显提高。

关 键 词:支持向量机  中文网页分类  文本分类  机器学习
收稿时间:2008-7-23
修稿时间:2008-10-23  

Efficient SVM Chinese Web page classifier based on pre-classification
XU Shi-ming,WU Bo,MA Cui,DI Si,XU Hong-kui,DU Ru-xu.Efficient SVM Chinese Web page classifier based on pre-classification[J].Computer Engineering and Applications,2010,46(1):125-128.
Authors:XU Shi-ming  WU Bo  MA Cui  DI Si  XU Hong-kui  DU Ru-xu
Affiliation:1.School of Computer Science and Technology,Xidian University,Xi'an 710071,China ;2.Shenzhen Institute of Advanced Technology,Chinese Academy of Sciences,Shenzhen,Guangdong 518067,China)
Abstract:Chinese Web page classification has been considered as a hot research area in data mining,and SVM is an effective method for learning the classification knowledge from massive data.In this paper,a model of automatic Chinese Web page classification system based on SVM is presented first.Then detailed design and implementation are introduced,and some key techniques about Chinese Web page classification,including Web page pre-processing,feature selection and weight computing are discussed.A pre-classification ...
Keywords:support vector machine  Chinese Web page classification  text classification  machine learning
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号