首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于支持向量机的专业中文网页分类器
引用本文:李亮,刘万春,徐泉清,朱玉文.一种基于支持向量机的专业中文网页分类器[J].计算机应用,2004,24(4):58-61.
作者姓名:李亮  刘万春  徐泉清  朱玉文
作者单位:北京理工大学,视觉与智能实验室,北京,100081
摘    要:文中提出了一种基于支持向量机的专业中文网页分类算法,利用支持向量机对网页进行二类分类,找出所需专业的中文网页;然后利用向量空间模型,对分类好的专业网页进行多类分类。在构造支持向量机的过程中,为了提高分类的召回率,采用了一种偏移因子。该算法只需要计算二类SVM分类器,实验表明,它不仅具有较高的训练效率,同时能得到很高的分类精确率和召回率。

关 键 词:支持向量机  向量空间模型  文本分类
文章编号:1001-9081(2004)04-0058-04

A Topic-specific Chinese Web Page Classifier Based on Support Vector Machine
LI Liang,LIU Wan-chun,XU Quan-qing,ZHU Yu-wen.A Topic-specific Chinese Web Page Classifier Based on Support Vector Machine[J].journal of Computer Applications,2004,24(4):58-61.
Authors:LI Liang  LIU Wan-chun  XU Quan-qing  ZHU Yu-wen
Abstract:This paper presents a topic-specific Chinese Web page classification algorithm based on support vector machine(SVM). The algorithm classifies Chinese Web pages by 2-kind SVM and finds out the Web pages in the topic-specific class. Then the topic-specific Web pages are classified in several child classes of the topic-specific class with vector space model(VSM). To improve the recall,an excursion factor is used in the procedure in which SVM is constructed. The algorithm only computes 2-kind SVM classifier,and experiment shows that it not only improves training efficiency,but also has good precision and recall.
Keywords:support vector machine  vector space model  text classification
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号