首页 | 本学科首页   官方微博 | 高级检索  
     

面向中文文本的情感信息抽取语料库构建
引用本文:戴 敏,朱 珠,李寿山,周国栋. 面向中文文本的情感信息抽取语料库构建[J]. 中文信息学报, 2015, 29(4): 67-73
作者姓名:戴 敏  朱 珠  李寿山  周国栋
作者单位:苏州大学 计算机科学与技术学院自然语言处理实验室, 江苏 苏州 215006
基金项目:国家自然科学基金(61003155,60873150);模式识别国家重点实验室开发课题基金
摘    要:情感信息抽取是情感分析中的一个重要子任务。虽然该任务已经开展有一段时间,但是面向中文文本的情感信息抽取任务研究才刚刚起步。目前中文文本的情感信息抽取面临的首要困难在于现有的相关中文语料库还非常有限。为了更好开展中文文本的情感信息抽取研究,该文重点研究了中文语料标注体系,构建一个规模较大、标注类型丰富的中文情感信息抽取语料库。除了常见语料库标注的情感倾向性、评价对象、情感词等信息外,重点标注了评价对象的省略、无情感词情感句表达及极性转移等情况。由语料信息统计可知,该文所指出的特殊现象(例如,评价对象的省略)在中文情感表达中是非常普遍的,开展这方面的研究很有必要。该文所构建的中文文本语料库将为中文情感信息抽取任务提供语料基础。

关 键 词:情感分析  情感信息抽取  中文语料库  

Corpus Construction on Opinion Information Extraction in Chinese
DAI Min,ZHU Zhu,LI Shoushan,ZHOU Guodong. Corpus Construction on Opinion Information Extraction in Chinese[J]. Journal of Chinese Information Processing, 2015, 29(4): 67-73
Authors:DAI Min  ZHU Zhu  LI Shoushan  ZHOU Guodong
Affiliation:NLP Lab, School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006, China
Abstract:Opinion information extraction (OIE) is an important sub-task in the research on sentiment analysis. Currently, one pressing issue in Chinese OIE is that the Chinese corpus is not readily avalable. This paper focuses on the annotation framework for Chinese OIE, and constrcuts a Chinese corpus containing rich information. Specifically, in additions to the popular elements including sentiment orientation, opinion target and opinion keyword, our corpus contains the information of opinion target ellipsis, the expressing opinion without sentimental words and the sentimental polarity shifting. The statistics show the popularity and necessity of these special points (e.g., opinion target ellipsis) in Chinese texts.
Keywords:sentiment analysis   opinion information extraction   Chinese corpus  
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号