首页 | 本学科首页   官方微博 | 高级检索  
     

一个中文文本自动分类器的设计
引用本文:董乐红,耿国华,周明全. 一个中文文本自动分类器的设计[J]. 计算机应用与软件, 2008, 25(4): 14-16
作者姓名:董乐红  耿国华  周明全
作者单位:西北大学信息科学与技术学院,陕西,西安,710069;西北大学信息科学与技术学院,陕西,西安,710069;北京师范大学信息科学与技术学院,北京,100875
基金项目:国家自然科学基金(60271032)资助.
摘    要:Boosting算法是目前流行的一种机器学习算法。采用Boosting家族的Adaboost.MH算法作为分类算法,设计了一个中文文本自动分类器,并给出了评估方法和结果。评价表明,该分类器和SVM的分类精度相当,而较基于其他分类算法的分类器有更好的分类精度。

关 键 词:文本分类  机器学习  Boosting算法
修稿时间:2006-08-15

DESIGN OF AN AUTOMATIC CLASSIFIER FOR CHINESE TEXT CATEGORIZATION
Dong Lehong,Geng Guohua,Zhou Mingquan. DESIGN OF AN AUTOMATIC CLASSIFIER FOR CHINESE TEXT CATEGORIZATION[J]. Computer Applications and Software, 2008, 25(4): 14-16
Authors:Dong Lehong  Geng Guohua  Zhou Mingquan
Affiliation:Dong Lehong1 Geng Guohua1 Zhou Mingquan1,21(College of Information Science , Technology,Northwest University,Xi'an 710069,Shaanxi,China)2(College of Information Science , Technology,Beijing Normal University,Beijing 100875,China)
Abstract:Boosting algorithm is a popular machine learning technology.An automatic classifier for Chinese text categorization is designed based on one of its series-AdaBoost Algorithm.The evaluation method is introduced.The evaluation results show that the classifier is more effective than many other classifiers,and its classification accuraly equals to that of SVM.
Keywords:Text categorization Machine learning Boosting algorithm  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号