首页 | 本学科首页   官方微博 | 高级检索  
     

词典与机器学习方法相结合的维吾尔语文本情感分析
引用本文:热西旦木·吐尔洪太,吾守尔·斯拉木,伊尔夏提·吐尔贡.词典与机器学习方法相结合的维吾尔语文本情感分析[J].中文信息学报,2017,31(1):177-183.
作者姓名:热西旦木·吐尔洪太  吾守尔·斯拉木  伊尔夏提·吐尔贡
作者单位:1. 新疆大学 信息科学与工程学院 新疆多语种重点实验室,新疆 乌鲁木齐 830046;
2. 伊犁师范学院 电子与信息工程学院,新疆 伊宁 835000
基金项目:国家“973”重点基础研究计划基金(2014CB340506);国家自然科学基金(61363063);新疆大学多语种重点实验室开放课题(XJDX0905-2013-02)
摘    要:随着互联网整体水平的提高,大量基于维吾尔文的网络信息不断建立,引起了对不同领域的信息进行情感倾向性分析的迫切需要。该文考虑到维吾尔文没有足够的情感训练语料和完整的情感词典,结合机器学习方法和词典方法的优点,构建一个分类器模型 LCUSCM(Lexicon-based and Corpus-based Uyghur Text Sentiment Classification Model),先用自己构建的维吾尔文情感词典对语料进行高质量的情感分类,分类过程中对词典进行递归扩充,再根据每条句子的情感得分,从词典分类的结果中选择一部分语料来训练一个分类器并改进第一步的分类结果。此方法的正确率比单独使用机器学习方法提高了9.13%, 比词典方法提高了1.82%。

关 键 词:维吾尔文  情感词典  情感分析  机器学习  

Uyghur Text Sentiment Analysis by Combining LexicalKnowledge with Machine Learning Methods
Rexidanmu Tuerhongtai,Wushour Silamu,Yierxiati Tuergong.Uyghur Text Sentiment Analysis by Combining LexicalKnowledge with Machine Learning Methods[J].Journal of Chinese Information Processing,2017,31(1):177-183.
Authors:Rexidanmu Tuerhongtai  Wushour Silamu  Yierxiati Tuergong
Abstract:With the development of the Internet, a large number of online Uyghur texts appeared, which demands sentiment analysis for different applications. Considering there are not neither enough training data nor a complete sentiment lexicon for Uyghur sentiment analysis, this paper combines the Lexicon-based method with Corpus-based method, proposing a so-called LCUSCM (Lexicon-based and Corpus-based Uyghur Text Sentiment Classification Model). It first classifies the text by using a manual-built Uyghur sentiment dictionary, with the lexicon is enriched incrementally in this process.Then, the reliable classified sentences are selected to train a classifier so as to refine the results of the first step. The accuracy of the hybrid method increased 9.13% than using machine learning method, and 1.82% than the lexicon based method.
Keywords:Uyghur  sentiment lexicon  sentiment analysis  machine learning  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号