首页 | 本学科首页   官方微博 | 高级检索  
     

基于语言建模的文本情感分类研究
引用本文:胡熠,陆汝占,李学宁,段建勇,陈玉泉.基于语言建模的文本情感分类研究[J].计算机研究与发展,2007,44(9):1469-1475.
作者姓名:胡熠  陆汝占  李学宁  段建勇  陈玉泉
作者单位:上海交通大学计算机科学与工程系 上海200240(胡熠,陆汝占,段建勇,陈玉泉),上海交通大学计算机科学与工程系 上海200240江南大学外语研究学院无锡214122(李学宁)
摘    要:提出了一种基于语言建模的文本情感分类的方法.将文本的情感倾向标记为"赞扬"或"批评",可以为文本提供主题之外的语义信息.为此提出了从训练数据中分别估计出代表"赞扬"和"批评"两种情感倾向的语言模型,然后通过比较测试文本自身的语言模型和这两种训练好的情感模型之间的Kullback-Leibler距离,分类测试文本的思路.各个模型的参数分别选用词形特征的unigram和bigram,而相应的参数估计也分别尝试了最大似然和平滑两种策略.当在电影评论语料上和代表不同分类模型的支持向量机及朴素贝叶斯分类器进行比较时,语言建模的方法表现出了较好的分类性能和鲁棒性.

关 键 词:情感分类  语言建模  KL距离  监督学习  鲁棒性  语言建模  文本情感  分类研究  Text  Sentiment  Classification  Based  Language  Modeling  鲁棒性  分类性能  表现  朴素贝叶斯分类器  支持向量机  分类模型  语料  电影评论  策略  平滑  最大似然  参数估计  bigram
修稿时间:2006-09-20

Research on Language Modeling Based Sentiment Classification of Text
Hu Yi,Lu Ruzhan,Li Xuening,Duan Jianyong,Chen Yuquan.Research on Language Modeling Based Sentiment Classification of Text[J].Journal of Computer Research and Development,2007,44(9):1469-1475.
Authors:Hu Yi  Lu Ruzhan  Li Xuening  Duan Jianyong  Chen Yuquan
Affiliation:1. Department of Computer Science and Engineering, Shanghai Jiao Tong University, Shanghai 200240; 2 School of Foreign Languages Study, Southern Yangtze University, Wuxi 214122
Abstract:
Keywords:sentiment classification  language modeling  KL divergence  supervised learning  robustness
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号