首页 | 本学科首页   官方微博 | 高级检索  
     

情感语料库的构建和分析
引用本文:徐琳宏,林鸿飞,赵晶.情感语料库的构建和分析[J].中文信息学报,2008,22(1):116-122.
作者姓名:徐琳宏  林鸿飞  赵晶
作者单位:大连理工大学 计算机科学与工程系,辽宁 大连 116024
基金项目:国家自然科学基金资助项目(60373095,60673039),国家863高科技计划资助项目(2006AA01Z151),教育部留学回国人员科研启动基金资助项目
摘    要:本文介绍了情感语料库构建方面的一些经验,讨论了在设计和建设情感语料库中的几个基本问题制定标注规范、选择标注集、设计标注工具以及标注过程中的质量监控。目前已经标注完成近4万句,100万字的语料。在完成这些已标注语料的基础上,进一步给出了语料库的情感分布,情感迁移规律等统计数据,分析了情感语料库的特点及应用。它的建成将为文本情感计算提供更加强大的资源支持。

关 键 词:计算机应用  中文信息处理  情感语料库  文本编码规范  一致性检查  情感迁移  
文章编号:1003-0077(2008)01-0116-07
收稿时间:2007-05-20
修稿时间:2007-12-01

Construction and Analysis of Emotional Corpus
XU Lin-hong,LIN Hong-fei,ZHAO Jing.Construction and Analysis of Emotional Corpus[J].Journal of Chinese Information Processing,2008,22(1):116-122.
Authors:XU Lin-hong  LIN Hong-fei  ZHAO Jing
Affiliation:Department of Computer Science and Engineering, Dalian University of Technology, Dalian, Liaoning 116024, China
Abstract:This paper introduced some experiences on constructing emotional corpus, and discussed several basic questions which included the tagging criterion, tagging set, tagging tools and quality monitoring. There were about 40 000 sentences in the corpus. Moreover based on these, statistical data about emotional distribution and rules of emotional transference were available, and characters and applications of corpus were analyzed, so emotional corpus provide support for text affective computing.
Keywords:computer application  Chinese information processing  emotional corpus  text coding initiative  consistency checking  emotional transference
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号