基于word embedding和CNN的情感分类模型 |
| |
作者姓名: | 蔡慧苹 王丽丹 段书凯 |
| |
作者单位: | 西南大学 电子信息工程学院,西南大学 电子信息工程学院,西南大学 电子信息工程学院 |
| |
基金项目: | 国家自然科学基金(61372139),教育部“春晖计划”科研项目(z2011148) |
| |
摘 要: | 尝试将word embedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用Skip-Gram模型训练出数据集中每个词的word embedding,然后将每条样本中出现的word embedding组合为二维特征矩阵作为卷积神经网络的输入;此外,每次迭代训练过程中,输入特征也作为参数进行更新。其次,设计了一种具有3种不同大小卷积核的神经网络结构,从而完成多种局部抽象特征的自动提取过程。与传统机器学习方法相比,所提出的基于word embedding和CNN的情感分类模型成功将分类正确率提升了5.04%。
|
关 键 词: | 卷积神经网络 自然语言处理 深度学习 词嵌入 情感分类 |
收稿时间: | 2015-06-03 |
修稿时间: | 2016-08-21 |
|
| 点击此处可从《计算机应用研究》浏览原始摘要信息 |
|
点击此处可从《计算机应用研究》下载全文 |
|