首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的KNN文本分类
引用本文:钟将,刘荣辉. 一种改进的KNN文本分类[J]. 计算机工程与应用, 2012, 48(2): 142-144
作者姓名:钟将  刘荣辉
作者单位:重庆大学 计算机学院,重庆 400044
基金项目:国家自然科学基金重点项目(No.90818028); 重庆市自然科学基金(No.2010BB2046); “211工程”三期建设项目(No.S-10218)
摘    要:在文本分类中,文本特征空间维数巨大以及训练样本分布不均衡等问题影响分类性能。针对这个问题,提出一种改进的KNN分类方法。利用隐含语义分析方法对特征样本空间进行降维处理;利用基于样本密度的改进的KNN分类器进行分类。实验结果表明提出的方法能够收到较好的分类效果。

关 键 词:特征降维  潜在语义分析  K-最近邻法  文本分类  
修稿时间: 

Improved KNN text categorization
ZHONG Jiang , LIU Ronghui. Improved KNN text categorization[J]. Computer Engineering and Applications, 2012, 48(2): 142-144
Authors:ZHONG Jiang    LIU Ronghui
Affiliation:College of Computer Science, Chongqing University, Chongqing 400044, China
Abstract:In text categorization, the problems of large feature dimension and samples data distributed imbalanced influence the classified results. To this problem, this paper puts forward an improved KNN method. Using latent semantic analysis to reduce dimensionality of text feature matrix. Using improved KNN method based on density to realize text categorization. The experimental results show that the proposed method can effectively improve the text categorization precision.
Keywords:feature reduction  latent semantic analysis  K-Nearest Neighbor(KNN)  text categorization
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号