首页 | 本学科首页   官方微博 | 高级检索  
     

商家评论的情感分类研究和应用
引用本文:袁立宇,鞠久朋,杨豪杰,宋平波. 商家评论的情感分类研究和应用[J]. 电信科学, 2011, 27(6)
作者姓名:袁立宇  鞠久朋  杨豪杰  宋平波
作者单位:中国电信股份有限公司广东研究院;海量信息技术有限公司;
摘    要:大多数基于有指导机器学习方法的情感分类采用N元(n-gram)词袋(bag-of-words)模型,使用二值(binary)作为特征项的权重。本文系统地分析了信息检索中常用的特征权重计算方法,并从项频、倒文档率、归一化因子等角度加以借鉴和改进,研究其在商家评论上的应用。最主要的改进在于考虑了特征项在不同类别中分布情况的差异以及对倒文档率的平滑。在餐饮评论语料上的实验结果表明,经典的tf.idf若干变形,尤其是倒文档率类差异(delta idf)及平滑因子(smoothing factor)的引入,能有效提高分类准确率。在酒店、电脑、书籍等领域的在线评论公开数据集上也取得了较好的性能,证明了方法的普遍适用性。这一方法目前已经在中国电信号码百事通业务中用于餐饮商家及优惠券推荐,效果良好。

关 键 词:商家评论  消费偏好  情感分析  褒贬分类  特征权重  

Feature Weighting for Sentiment Classification of Online Chinese Reviews
Yuan Liyu,Ju Jiupeng,Yang Haojie,Song Pingbo. Feature Weighting for Sentiment Classification of Online Chinese Reviews[J]. Telecommunications Science, 2011, 27(6)
Authors:Yuan Liyu  Ju Jiupeng  Yang Haojie  Song Pingbo
Affiliation:Yuan Liyu1,Ju Jiupeng2,Yang Haojie1,Song Pingbo1(1.Guangdong Research Institute of China Telecom Co.,Ltd.,Guangzhou 510630,China,2.Hylanda Information Technology Co.,Beijing 100190,China)
Abstract:Most supervised machine learning method based sentiment classifications apply binary n-gram weights.In this paper,we systematically explore whether more sophisticated feature weighting schemes adapted from information retrieval(IR) can enhance the accuracy of sentiment classification for business reviews.Considered points of view are term frequency(tf),delta inverse document frequency(idf),and smoothing factor.Using restaurant reviews from the number wizard service created by China Telecom as experimental d...
Keywords:business review  consumer preference  sentiment analysis  polarity classification  feature weightin  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号