首页 | 本学科首页   官方微博 | 高级检索  
     

基于自身特征扩展的短文本分类方法
引用本文:胡学钢,杨超群,张玉红.基于自身特征扩展的短文本分类方法[J].计算机应用研究,2017,34(4).
作者姓名:胡学钢  杨超群  张玉红
作者单位:计算机与信息学院,计算机与信息学院,计算机与信息学院
基金项目:国家自然科学基金项目(面上项目,重点项目,重大项目);国家教育部博士点基金
摘    要:短文本具有特征稀疏、描述概念信号弱等特点,传统方法对短文本进行分类很难取得较好结果。针对上述问题,提出了一种基于自身特征扩展的短文本分类方法SC-FE。该方法首先基于类内离散度从每个类中选取高类别指示性的特征组成特征空间,其次对样本的特征,在已选的特征空间中选取其相关度最大的特征加入短文本中进行扩充。在实际数据集上的实验结果表明,该方法可有效提高短文本分类效果。

关 键 词:短文本  稀疏  信号弱  扩展  离散度  相关度  
收稿时间:2016/3/2 0:00:00
修稿时间:2017/2/15 0:00:00

Short Text Classification Based on Extension with its own Features
huxuegang,yangchaoqun and zhangyuhong.Short Text Classification Based on Extension with its own Features[J].Application Research of Computers,2017,34(4).
Authors:huxuegang  yangchaoqun and zhangyuhong
Affiliation:school of computer and information,,
Abstract:
Keywords:Short text  sparseness  Weka signal  expansion  Dispersion degree  Correlation degree  
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号