首页 | 本学科首页   官方微博 | 高级检索  
     

面向短文本的动态组合分类算法
引用本文:闫瑞,曹先彬,李凯.面向短文本的动态组合分类算法[J].电子学报,2009,37(5):1019-1024.
作者姓名:闫瑞  曹先彬  李凯
作者单位:1. 中国科学技术大学计算机科学技术系,安徽合肥,230027;安徽省计算与通讯软件重点实验室,安徽合肥,230027
2. 解放军保密委员会技术安全研究所,北京,100091
基金项目:国家重点基础研究发展规划(973计划),国家高技术研究发展计划(863计划),教育部新世纪优秀人才支持计划 
摘    要: 短文本分类是网络内容安全的一种主要方法.然而,短文本固有的关键词特征稀疏和样本高度不均衡等特点,使得难以直接使用现有针对长文本的分类算法.本文提出了一种针对短文本的动态组合分类算法.首先构造出一种树状组合分类器结构,可有效缓解短文本特征稀疏和样本高度不均衡对分类性能的影响;进一步,提出了一种动态调整策略来训练组合分类器,可以根据样本的分布特点自适应地调整分类器的组合结构.测试实验表明,相对于传统的单一分类方法和集成分类方法,动态组合分类算法在短文本分类中可以获得更好的准确率和召回率.

关 键 词:短文本分类  组合分类器  动态调整策略  AdaBoost算法
收稿时间:2008-05-08

Dynamic Assembly Classification Algorithm for Short Text
YAN Rui,CAO Xian-bin,LI Kai.Dynamic Assembly Classification Algorithm for Short Text[J].Acta Electronica Sinica,2009,37(5):1019-1024.
Authors:YAN Rui  CAO Xian-bin  LI Kai
Affiliation:1.Department of Computer Science and Technology;University of Science and Technology of China;Hefei;Anhui 230027;China;2.Key Laboratory of Software in Computing and Communication;3.Institute of Technical Security;PLA;Beijing 100091;China
Abstract:Short text classification is a key technology in network content security application.However,the sparse features and unbalanced data of the short text make the traditional text classification method incompetent for short text classification.This paper proposed a dynamic assembly classification method for short text classification.In this method,a treelike assembly classifier was constructed to support the classification,which reduced the impact of the sparse features and unbalanced data of the short texts....
Keywords:short text classification  assembly classifier  dynamic adjusting strategy  adaBoost    
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《电子学报》浏览原始摘要信息
点击此处可从《电子学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号