首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进卡方统计的微博特征提取方法
引用本文:徐明,高翔,许志刚,刘磊.基于改进卡方统计的微博特征提取方法[J].计算机工程与应用,2014(19):113-117,142.
作者姓名:徐明  高翔  许志刚  刘磊
作者单位:1. 北京工业大学 现代教育技术中心,北京,100124
2. 北京工业大学 数理学院,北京,100124
基金项目:国家自然科学基金(No.61105040,No.61203284,No.61272361);北京市自然科学基金(No.4133085);北京市教委青年拔尖人才培育计划;北京工业大学数学统计学基础科学研究基金(No.006000542213501)。
摘    要:通过对微博文本特征信息的分析与研究,提出一种基于改进卡方统计的微博特征提取方法。扩充微博信息分类特征,在传统的卡方统计量的基础上,引入了频度等因素,改进特征选择方法;在传统的特征项权值计算的基础上,提出了新的改进卡方统计量的方法,改进权重计算效果。对上述方法利用经典KNN和SVM算法进行了测试,实验结果表明该方法提高了微博信息分类的准确率。

关 键 词:微博分类  卡方统计量  特征选择  权值计算

Feature selection methods of microblogging based on improved CHI-square statistics
XU Ming,GAO Xiang,XU Zhigang,LIU Lei.Feature selection methods of microblogging based on improved CHI-square statistics[J].Computer Engineering and Applications,2014(19):113-117,142.
Authors:XU Ming  GAO Xiang  XU Zhigang  LIU Lei
Abstract:
Keywords:microblogging classification  CHI-square statistics  feature selection  weight calculation
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号