首页 | 本学科首页   官方微博 | 高级检索  
     

文本褒贬倾向判别研究
引用本文:李银花,王素格.文本褒贬倾向判别研究[J].计算机工程与应用,2011,47(18):160-162.
作者姓名:李银花  王素格
作者单位:1.太原科技大学 应用科学学院,太原 030024 2.山西大学 计算机与信息技术学院,太原 030006
基金项目:国家自然科学基金,教育部高等学校博士点基金,山西省自然科学基金,太原市科技局明星专项,山西省科技攻关项目
摘    要:在文本的向量空间表示模型下,针对文本褒贬倾向判别问题,提出了一种基于潜在语义分析的特征权重计算方法。除词频信息外,该方法考虑了潜在语义分析所提供的同义词、近义词信息对特征权重的影响。采用基于Fisher判别准则的特征选择方法,以支持向量机作为分类器,在2 739篇语料(2008年中文倾向性分析评测)上进行了实验。实验结果表明,提出的特征权重计算方法对文本褒贬倾向判别是有效的。

关 键 词:文本褒贬倾向判别  概率潜在语义分析  Fisher判别准则  支持向量机  
修稿时间: 

Research on text commendatory-derogatory orientation discrimination
LI Yinhua,WANG Suge.Research on text commendatory-derogatory orientation discrimination[J].Computer Engineering and Applications,2011,47(18):160-162.
Authors:LI Yinhua  WANG Suge
Affiliation:1.School of Applied Science,Taiyuan University of Science and Technology,Taiyuan 030024,China 2.School of Computer and Information Technology,Shanxi University,Taiyuan 030006,China
Abstract:On the basis of vector space model of text expression,a feature weight computing method for text commendatory-derogatory orientation discrimination is proposed based on Probabilistic Latent Semantic Analysis(PLSA).In addition to the word frequency of a feature,the information of its thesaurus and homoionym latently obtained by PLSA is taken in consider- ation to weight computing.Using the feature selection method based on Fisher criterion,and constructing a classifier with Sup- port Vector Machine(SVM),an experiment is conducted under a Chinese review text corpus with size of 2 739 documents (COAE2008).The experimental results indicate that the presented weight computing method based on PLSA is effective.
Keywords:text commendatory-derogatory orientation discrimination  Probabilistic Latent Semantic Analysis(PLSA)  Fisher dis- crimination criterion  Support Vector Machine(SVM)
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号