基于Hadoop的朴素贝叶斯算法在中文微博情感分类中的研究与应用 |
| |
作者单位: | ;1.华东师范大学计算机科学技术系 |
| |
摘 要: | 通过对文本情感分类的研究,考虑微博文本信息的篇幅短小、情感符号丰富及大量网络词汇的特点,提出一种适用于中文微博情感分类的基于Map/Reduce的分布式朴素贝叶斯算法。算法通过构建适用于微博文本的情感词典来完成情感特征属性的提取,以期达到较为理想的分类效果。实验结果表明,这种方法能够很好地适用于微博情感分类,达到较理想的分类效果,满足针对海量的微博文本数据处理的可行性与高效性的需求。
|
关 键 词: | 微博 情感分类 Hadoop Map/Reduce 朴素贝叶斯 |
RESEARCH AND APPLICATION OF HADOOP-BASED NA(I)VE BAYES ALGORITHM IN SENTIMENT CLASSIFICATION OF CHINESE MICROBLOGGING |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 万方数据 等数据库收录! |
|