首页 | 本学科首页   官方微博 | 高级检索  
     

使用基于SVM的局部潜在语义索引进行文本分类
引用本文:张秋余,刘洋.使用基于SVM的局部潜在语义索引进行文本分类[J].计算机应用,2007,27(6):1382-1384.
作者姓名:张秋余  刘洋
作者单位:兰州理工大学,计算机与通信学院,甘肃,兰州,730050;兰州理工大学,计算机与通信学院,甘肃,兰州,730050;渤海大学,信息科学与工程学院,辽宁,锦州,121000
摘    要:潜在语义索引(LSI)通过奇异值分解(SVD)获得原始词—文档矩阵的潜在语义结构,在一定程度上解决了一词多义和多词一义问题。但目前文本分类中使用LSI方法的效果并不理想,这是因为没有充分考虑分类信息。为解决该问题,提出一种改进的局部潜在语义索引(LLSI)方法,使用支持向量机(SVM)来产生局部区域。实验结果表明,该方法是有效的。

关 键 词:文本分类  潜在语义索引  支持向量机  局部区域
文章编号:1001-9081(2007)06-1382-03
收稿时间:2006-12-13
修稿时间:2006-12-13

Using SVM-based LLSI for text classification
ZHANG Qiu-yu,LIU Yang.Using SVM-based LLSI for text classification[J].journal of Computer Applications,2007,27(6):1382-1384.
Authors:ZHANG Qiu-yu  LIU Yang
Affiliation:1. College of Computer and Communication, Lanzhou University of Technology, Lanzhou Gansu 730050, China; 2. College of Information Science and Engineering, Bohai University, Jinzhou Liaoning 121000, China
Abstract:Latent Semantic Indexing (LSI) uses Singular Value Decomposition (SVD) to obtain latent semantic structure of original term-document matrix, and problems of polysemy and synonymy can be dealt with to some extent. However, the present available methods of applying LSI to text classification are not satisfying, since they do not take full account of classification information. To solve the problem, an improved Local LSI (LLSI) method was proposed, using Support Vector Machine (SVM) to produce the local region. Experimental results suggest that the proposed method is effective.
Keywords:text classification  Latent Semantic Indexing (LSI)  Support Vector Machine (SVM)  local region
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机应用》浏览原始摘要信息
点击此处可从《计算机应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号