首页 | 本学科首页   官方微博 | 高级检索  
     

一种级联式微博情感分类器的构建方法
引用本文:张仰森,孙旷怡,杜翠兰,王建,佟玲玲. 一种级联式微博情感分类器的构建方法[J]. 中文信息学报, 2017, 31(5): 178-184
作者姓名:张仰森  孙旷怡  杜翠兰  王建  佟玲玲
作者单位:1.北京信息科技大学 智能信息处理研究所,北京 100192;
2.国家计算机网络应急技术处理协调中心,北京 100190
基金项目:国家自然科学基金(61370139);北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)
摘    要:该文从统计学方法与机器学习的分类思想出发,对中文微博文本的情感类别进行研究。针对微博文本的特点,提出了一种级联式微博情感分类器模型,该模型首先构建基于情感词典和新浪表情符号词典的微博情感初级分类模型;然后根据基准词构建基于类别倾向相似度的二级分类模型,对初级模型未能确定情感类别的微博进行再次分类,并对初级模型的词典进行更新;最后采用朴素贝叶斯分类器构建三级分类模型,对以上还未确定情感类别的微博进行三级分类。通过与NLPCC2014微博情感分类评测参赛结果进行比较,说明了所提方法的有效性。

关 键 词:微博  情感词典  基准词  朴素贝叶斯模型  级联式分类器  

A Cascaded Construction of Sentiment Classifier for Micro-blogs
ZHANG Yangsen,SUN Kuangyi,DU Cuilan,WANG Jian,TONG Lingling. A Cascaded Construction of Sentiment Classifier for Micro-blogs[J]. Journal of Chinese Information Processing, 2017, 31(5): 178-184
Authors:ZHANG Yangsen  SUN Kuangyi  DU Cuilan  WANG Jian  TONG Lingling
Affiliation:1.Institute of Intelligent Information Processing, Beijing Information Science and Technology University, Beijing 100192, China;
2.National Computer Network Emergency Response Technical Team/Coordination Center of China, Beijing 100190, China
Abstract:This paper proposes a cascaded classifier micro-blog sentiment analysis. The primary classifier is based on emotional dictionary and sina micro-blog emoticons dictionary. The secondary classifier is based on the orientation similarity, grouped by several key sentimental word. And the third-level classifier is built by using Nave Bayes. The micro-blogs are processed by the three classifiers in a pipeline style. The experimental results show that the method is effective compared against the NLPCC2014 micro-blog sentiment evaluation results.
Keywords:micro-blog    sentiment dictionary    benchmark words    Nave Bayes model    cascade classifier  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号