首页 | 本学科首页   官方微博 | 高级检索  
     

基于支持向量机和输出编码的文本分类器研究
引用本文:刘良斌,王小平. 基于支持向量机和输出编码的文本分类器研究[J]. 计算机应用, 2004, 24(8): 32-34
作者姓名:刘良斌  王小平
作者单位:同济大学,计算机科学与工程系,上海,200092;同济大学,计算机科学与工程系,上海,200092
基金项目:国家自然科学基金项目(70171061)
摘    要:介绍了一种支持向量机与输出编码相结合的文本分类器算法 ,采用一对多、一对一和纠错编码三种编码方式以及相似度计算的海明码距、边界损失方法进行文本分类和测试 ,表明一对多编码与边界损失相似度计算相结合的分类器系统具有最高的查全率和查准率。

关 键 词:文本分类  支持向量机  输出纠错编码
文章编号:1001-9081(2004)08-0032-03

Text classifier based on support vector machine and output coding
LIU Liang-bin,WANG Xiao-ping. Text classifier based on support vector machine and output coding[J]. Journal of Computer Applications, 2004, 24(8): 32-34
Authors:LIU Liang-bin  WANG Xiao-ping
Abstract:A new kind of text category algorithm based on SVM(Support Vector Machine) theory and output coding is given. Six combined multiclassifiers which cover three encoding styles (one-to-many, one-to-one, ECOC) and two different similarity calculating methods (hamming similarity , losing-based similarity)is used to classify the documents . Experiments with these multiclassifiers show that the combination of one-to-many with losing-based similarity has the highest recall rate and the highest precision rate.
Keywords:text classification  SVM  error-correcting code
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号