首页 | 本学科首页   官方微博 | 高级检索  
     

跨领域倾向性分析相关技术研究
引用本文:吴琼,谭松波,张刚,段洣毅,程学旗. 跨领域倾向性分析相关技术研究[J]. 中文信息学报, 2010, 24(1): 77-84
作者姓名:吴琼  谭松波  张刚  段洣毅  程学旗
作者单位:1. 中国科学院 计算技术研究所,北京 100190; 2. 中国科学院 研究生院,北京 100049
基金项目:国家自然科学基金资助项目(60803085,60933005);;国家863高技术研究发展计划基金资助项目(2006AA010105-02,2007AA01Z416,2007AA01Z441);;国家重点基础研究发展计划(973)资助项目(2007CB311100)
摘    要:该文主要研究文本的倾向性分析问题,即判断文本中的论断是正面还是负面的。已有的研究表明,监督分类方法对倾向性分析很有效。但是,多数情况下,已有的标注数据与待判断倾向性的数据不属于同一个领域,此时监督分类算法的性能明显下降。为解决此问题,该文提出一个算法,将文本的情感倾向性与图排序算法结合起来进行跨领域倾向性分析,该算法在图排序算法基础上,利用训练域文本的准确标签与测试域文本的伪标签来迭代进行倾向性分析。得到迭代最终结果后,为充分利用其中倾向性判断较为准确的测试文本来提高整个测试集倾向性分析的精度,将这些较准确的测试文本作为“种子”,进一步通过EM算法迭代进行跨领域倾向性分析。实验结果表明,该文提出的方法能大幅度提高跨领域倾向性分析的精度。

关 键 词:计算机应用  中文信息处理  跨领域  倾向性分析  图排序  EM算法  

Research on Cross-Domain Opinion Analysis
WU Qiong,TAN Songbo,ZHANG Gang,DUAN Miyi,CHENG Xueqi. Research on Cross-Domain Opinion Analysis[J]. Journal of Chinese Information Processing, 2010, 24(1): 77-84
Authors:WU Qiong  TAN Songbo  ZHANG Gang  DUAN Miyi  CHENG Xueqi
Affiliation:1. Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China;
2. Graduate School of CAS, Beijing 100049, China
Abstract:This paper focuses on the opinion analysis of documents,i.e.to determine the overall opinion(e.g.,negative or positive) of a given document.Existing studies have shown that,the supervised classification approaches usually perform well in this task.However,in most cases,the performance decreases sharply when the model is transferred from the labeled data domain to a different target domain without labeled data.This raises the issue of cross-domain opinion analysis.In this paper,we propose an iterative algori...
Keywords:computer application  Chinese information processing  cross domain  opinion analysis  graph ranking  EM algorithm  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《中文信息学报》浏览原始摘要信息
点击此处可从《中文信息学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号