首页 | 本学科首页   官方微博 | 高级检索  
     

面向中文网络评论情感分类的集成学习框架
引用本文:黄佳锋,薛云,卢昕,刘志煌,吴威,黄英仁,李万理,陈鑫.面向中文网络评论情感分类的集成学习框架[J].中文信息学报,2018,32(9):113-122.
作者姓名:黄佳锋  薛云  卢昕  刘志煌  吴威  黄英仁  李万理  陈鑫
作者单位:1.华南师范大学 物理与电信工程学院,广东 广州 510006;
2.广东省数据科学工程技术研究中心,广东 广州 510006;
3.深圳职业技术学院 工业中心,广东 深圳 518055
基金项目:全国统计科学研究项目(2016LY98);广东省科技计划项目(2016A010101020,2016A010101021,2016A010101022);深圳市科创委基础研究项目(JCYJ20160527172144272);广东省数据科学工程技术研究中心课题(2016KF09,2016KFl0);广东科学技术职业学院科研项目(XJSC2016206)
摘    要:该文针对中文网络评论情感分类任务,提出了一种集成学习框架。首先针对中文网络评论复杂多样的特点,采用词性组合模式、频繁词序列模式和保序子矩阵模式作为输入特征。然后采用基于信息增益的随机子空间算法解决文本特征繁多的问题,同时提高基分类器的分类性能。最后基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向。实验结果表明了该框架在中文网络评论情感分类任务上的有效性,特别是在Logistic Regression分类算法上准确率达到90.3%。

关 键 词:网络评论  情感分类  集成学习  特征提取  

An Ensemble Learning Framework for Sentiment Classification of Chinese Online Reviews
HUANG Jiafeng,XUE Yun,LU Xin,LIU Zhihuang,WU Wei,HUANG Yingren,LI Wanli,CHEN Xin.An Ensemble Learning Framework for Sentiment Classification of Chinese Online Reviews[J].Journal of Chinese Information Processing,2018,32(9):113-122.
Authors:HUANG Jiafeng  XUE Yun  LU Xin  LIU Zhihuang  WU Wei  HUANG Yingren  LI Wanli  CHEN Xin
Affiliation:1.School of Physics and Telecommunication Engineering, South China Normal University, Guangzhou, Guangdong 510006, China;
2.Guangdong Provincial Engineering Technology Research Center for Data Science, Guangzhou, Guangdong 510006, China;
3.Industrial Center, Shenzhen PolyTechnic, Shenzhen, Guangdong 518055, China
Abstract:We propose an ensemble learning framework for sentiment classification of Chinese online reviews. Firstly,according to the complicated characteristics of Chinese online reviews,we combine the POS pattern,the frequent word sequence pattern and the OPSM pattern as the input features. Secondly,to deal with the massive features in the reviews,we use the random subspace based on information gain algorithm,which can enhance the base classifiers simultaneously. Finally,we design base classifiers for each product aspect so as to combine the sentiment information of each aspect in a review. The experimental results show that our framework leads to significant improvement in sentiment classification of Chinese online reviews,with an accuracy of 90.3% on Logistic Regression.
Keywords:online reviews  sentiment classification  ensemble learning  feature extraction  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号