首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于LDA主题模型的评论文本情感分类方法
引用本文:王伟周咏梅阳爱民周剑峰,林江豪.一种基于LDA主题模型的评论文本情感分类方法[J].数据采集与处理,2017,32(3):629-635.
作者姓名:王伟周咏梅阳爱民周剑峰  林江豪
作者单位:1.广东外语外贸大学思科信息学院,广州,510006; 2.广东外语外贸大学语言工程与计算实验室,广州,510006; 3.广东外语外贸大学图书馆,广州,510006;4.广东外语外贸大学财务处, 广州,510420
摘    要:针对互联网出现的评论文本情感分析,引入潜在狄利克雷分布(Latent Dirichlet allocation,LDA)模型,提出一种分类方法。该分类方法结合情感词典,依据指定的情感单元搭配模式,提取情感信息,包括情感词和上、下文。使用主题模型发掘情感信息中的关键特征,并融入到情感向量空间中。最后利用机器学习分类算法,实现中文评论文本的情感分类。实验结果表明,提出的方法有效降低了特征向量的维度,并且在文本情感分类上有很好的效果。

关 键 词:评论文本  情感单元  潜在主题  情感分析  机器学习

Method of Sentiment Analysis for Comment Texts Based on LDA
Abstract:A method of sentiment analysis for online comment texts is proposd based on the latent Dirichlet allocation (LDA) model. The method extracts the sentiment information containing sentiment words and context with the sentiment word dictionary according to the specified collocation patterns of sentiment unit. Use the LDA model to mine the key features of the sentiment information and then combine them into the sentiment vector space. The machine-learning algorithm is used to classify the sentiment polarity of Chinese comment texts. After experiment, the presented method is proved to be effective in reducing dimensionality and text sentiment classification.
Keywords:comment text  sentiment unit  latent topic  sentiment analysis  machine learning
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号