首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于数据偏斜的改进KNN文本分类
引用本文:刘海峰,陈琦,刘守生,苏展.一种基于数据偏斜的改进KNN文本分类[J].微电子学与计算机,2010,27(3).
作者姓名:刘海峰  陈琦  刘守生  苏展
作者单位:解放军理工大学理学院,江苏南京,210007
摘    要:KNN是一种简单、有效、非参数的分类算法.针对样本分布偏斜的分类环境,首先提出了一种改进的特征选择方法进行特征降维,在此基础上进一步提出了一种基于分布的改进KNN方法用于文本分类,降低了分布偏斜问题对决策函数的影响.试验表明,所提出的改进KNN文本分类方法具有较好的分类性能.

关 键 词:特征选择  文本分类  改进KNN  相似度

An Improved KNN Text Categorization Method Based on Data Uneven
LIU Hai-feng,CHEN Qi,LIU Shou-sheng,SU Zhan.An Improved KNN Text Categorization Method Based on Data Uneven[J].Microelectronics & Computer,2010,27(3).
Authors:LIU Hai-feng  CHEN Qi  LIU Shou-sheng  SU Zhan
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号