首页 | 本学科首页   官方微博 | 高级检索  
     

自动文本分类技术研究
引用本文:祝晓鲁,白振兴,贾海燕. 自动文本分类技术研究[J]. 现代电子技术, 2007, 30(3): 121-124
作者姓名:祝晓鲁  白振兴  贾海燕
作者单位:空军工程大学,工程学院,陕西,西安,710038
摘    要:随着万维网的发展,文本分类成为处理和组织大量文档数据的关键技术。在阐述了文本分类算法的研究现状,分析了朴素贝叶斯(Na ve Bayes)、kNN和支持向量机(SVM)经典文本分类算法之后,提出了应用最小二乘支持向量机(LSSVM)算法来实现文本分类。对使用用最小二乘支持向量机和一般支持向量机的文本分类结果进行了比较,并得出了结论:使用最小二乘支持向量机进行文本分类缩短了文本分类的时间,并保证了一定的召回率和准确率。

关 键 词:文本分类  支持向量机  最小二乘支持向量机  分类器
文章编号:1004-373X(2007)03-121-04
收稿时间:2006-06-28
修稿时间:2006-06-28

A Survey of Algorithm of Text Categorization
ZHU Xiaolu,BAI Zhenxing,JIA Haiyan. A Survey of Algorithm of Text Categorization[J]. Modern Electronic Technique, 2007, 30(3): 121-124
Authors:ZHU Xiaolu  BAI Zhenxing  JIA Haiyan
Abstract:With the rapid development of World Wide Web,text classification has become the key technology in organizing and processing large amount of document data.After prolific research results in this field are illustrated involving in typical algorithms Which include Naive Bayes,kNN and Support Vector Machine(SVM),it is presented that realization of text categorization with LS-SVM.The experimental result shows that the performance of LS-SVM is comparable to common SVM with much reduction on the time cost in the text categorizaion process.
Keywords:text categorization  support vector machine  least squares support vecotr machine  classifier
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号