基于级联模型的中文情感要素抽取 |
| |
作者姓名: | 王亚珅 黄河燕 冯冲 刘全超 |
| |
作者单位: | 北京理工大学计算机学院北京市海量语言信息处理与云计算应用工程技术研究中心,北京,100081 |
| |
基金项目: | 国家重点基础研究发展计划(973计划)资助项目(No.2013CB329605,No.2013CB329303);国家自然科学基金(61132009,61201351) |
| |
摘 要: | 随着社交媒体的发展及成熟,每天在互联网环境中都会产生大量的用户评论信息。抽取评价短语、评价对象和观点持有者等情感要素,已经成为了中文观点挖掘和情感分析的重要先决任务。针对中文情感要素抽取任务,本文提出了一个统计和规则相结合的级联模型,主要贡献包括:(1)针对汽车领域评论信息,构建情感要素标注语料库和相关词典;(2)对于以往研究较少关注的中文评价短语,本文详细分析阐述其定义和分类;(3)结合统计和规则,分别针对评价短语和情感要素提出级联抽取策略。实验结果充分证明了该级联模型的有效性,相比较于其它基于规则的情感要素抽取算法有效提升了召回率,同时为后续社交媒体情感分析任务提供了有力的支持。
|
关 键 词: | 信息抽取 情感要素 评价短语 评价对象 观点持有者 |
收稿时间: | 2015-02-11 |
本文献已被 万方数据 等数据库收录! |
| 点击此处可从《电子学报》浏览原始摘要信息 |
|
点击此处可从《电子学报》下载全文 |
|