基于多特征与复合分类法的中文微博情感分析 |
| |
引用本文: | 吴维,肖诗斌.基于多特征与复合分类法的中文微博情感分析[J].北京机械工业学院学报,2013(4):39-45. |
| |
作者姓名: | 吴维 肖诗斌 |
| |
作者单位: | 北京信息科技大学 网络文化与数字传播北京市重点实验室 |
| |
基金项目: | 国家自然科学基金项目资助(61171159、61271304) |
| |
摘 要: | 为了提高微博的情感分析的准确率,选取微博文本中的动词和形容词作为特征,提出了基于层次结构的特征降维方法,采用基于表情符号的方法计算特征极性值。在此基础上,提出了基于特征极性值的位置权重计算方法,借助支持向量机(SVM)作为机器学习模型将微博文本分为正面、负面和中性3类。也就是多特征提取,结合字典法与机器学习法2种算法,来提高情感分析的准确率。实验结果表明,该方法能取得平均为72.16%的准确率。提出的基于多特征与复合分类器的情感分析方法能够比较有效地对中文微博文本进行情感分类。
|
关 键 词: | 微博 表情符号 复合分类法 位置权重 情感分类 |
本文献已被 CNKI 等数据库收录! |
|