首页 | 本学科首页   官方微博 | 高级检索  
     

基于支持向量机的文本倾向性分类研究
引用本文:王素格,杨安娜,李德玉,魏英杰,李伟,张武.基于支持向量机的文本倾向性分类研究[J].中北大学学报,2008,29(5).
作者姓名:王素格  杨安娜  李德玉  魏英杰  李伟  张武
作者单位:[1]山西大学数学科学学院,山西太原030006 [2]山西大学计算机与信息技术学院,山西太原030006 [3]上海大学计算机工程与科学学院,上海200072
基金项目:国家自然科学基金,教育部科学技术研究重点项目,山西省自然科学基金,山西省科技攻关项目,山西省高等学校科研开发基金
摘    要:文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.

关 键 词:文本倾向性分类  支持向量机  特征选择  信息增益

Research on Text Orientation Classification Based on Support Vector Machine
WANG Su-ge,YANG An-na,LI De-yu,WEI Ying-jie,LI Wei,ZHANG Wu.Research on Text Orientation Classification Based on Support Vector Machine[J].Journal of North University of China,2008,29(5).
Authors:WANG Su-ge    YANG An-na  LI De-yu  WEI Ying-jie  LI Wei  ZHANG Wu
Affiliation:WANG Su-ge1,3,YANG An-na1,LI De-yu2,WEI Ying-jie1,LI Wei1,ZHANG Wu3 (1.School of Mathematics Science,Shanxi University,Taiyuan 030006,China,2.School of Computer & Information Technology,3.School of Computer Engineering , Science,Shanghai University,Shanghai 200072,China)
Abstract:Text orientation classification can be widely applied to information retrieval,product online tracking,diagnoses of public opinions and chat systems.Two kinds of hybrid feature selecting methods based on words with restricted part of speech and information gain,and sentiment words and information gain are proposed respectively.A classifier based on support vector machine is designed for text orientation classification.As the training and testing data,review texts about car products,basketball games and Sino...
Keywords:text orientation classification  support vector machine  feature selection  information gain  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号