首页 | 本学科首页   官方微博 | 高级检索  
     

基于机器学习的文本情感倾向性分析
引用本文:陈平平,耿笑冉,邹敏,谭定英. 基于机器学习的文本情感倾向性分析[J]. 计算机与现代化, 2020, 0(3): 77-81,92. DOI: 10.3969/j.issn.1006-2475.2020.03.015
作者姓名:陈平平  耿笑冉  邹敏  谭定英
作者单位:广州中医药大学医学信息工程学院,广东 广州 510006;广州中医药大学医学信息工程学院,广东 广州 510006;广州中医药大学医学信息工程学院,广东 广州 510006;广州中医药大学医学信息工程学院,广东 广州 510006
基金项目:广州市高校创新创业教育项目
摘    要:为实现对网络上电影评论的情感倾向性分析,通过对电影影评数据进行爬取,获取热门的电影评论,利用文本预处理和机器学习算法,完成对数据的训练以及测试,最终构建最优情感分类模型。实验结果表明,在所有词与双词结合并进行jieba的TF-IDF及卡方统计的特征提取下,得到的效果较好,BP神经网络以及多项式贝叶斯算法比较适用于这类文本的分析,尤其以BP神经网络的效果最佳,准确率达到86.2%。

关 键 词:情感倾向分析   jieba分词   机器学习   BP神经网络算法   卡方统计  
收稿时间:2020-03-30

Analysis of Text Sentiment Orientation Based on Machine Learning
CHEN Ping-ping,GENG Xiao-ran,ZOU Min,TAN Ding-ying. Analysis of Text Sentiment Orientation Based on Machine Learning[J]. Computer and Modernization, 2020, 0(3): 77-81,92. DOI: 10.3969/j.issn.1006-2475.2020.03.015
Authors:CHEN Ping-ping  GENG Xiao-ran  ZOU Min  TAN Ding-ying
Abstract:In order to realize the emotional orientation analysis of movie reviews on the Internet, the film review data is crawled to obtain popular movie reviews, and text preprocessing and machine learning algorithms are used to complete the training and testing of the data, and finally the most superior sentiment classification model is constructed. The experimental results show that under the combination of all words and double words and the feature extraction of jieba’s TF-IDF and Chi-square statistics, the BP neural network and polynomial Bayesian algorithm are more suitable for the analysis of this kind of text, especially BP neural network is the best, the accuracy rate reaches 86.2%.
Keywords:sentiment analysis  jieba  machine learning  Back Propagation Neural Network algorithm  Chi-square statistics  
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机与现代化》浏览原始摘要信息
点击此处可从《计算机与现代化》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号