首页 | 本学科首页   官方微博 | 高级检索  
     

一种新的基于密度的k-最近邻文本分类器训练样本约减方法
引用本文:徐义峰,陈春明,徐云青.一种新的基于密度的k-最近邻文本分类器训练样本约减方法[J].计算机系统应用,2007,16(11):127-128.
作者姓名:徐义峰  陈春明  徐云青
作者单位:1. 衢州学院信息与电子工程系,浙江衢州,324000
2. 桂林电子科技大学图书馆,广西桂林,541004
摘    要:本文针对k-最近邻方法分类效率不高的问题,提出了一种基于密度的训练样本集约减算法.该方法通过计算训练样本集中各类别的类别密度及整个训练集的平均密度,去掉高密度类别中的部分样本,使训练样本集具有更好的代表性.实验表明,该方法不仅提高了k-最近邻方法的分类效率,而且对其分类准确率也有一定程度的提高.

关 键 词:文本分类  k-最近邻方法  训练样本  基于密度  最近邻  文本分类器  训练样本集  约减算法  方法分类  Text  Classification  Training  Method  Based  程度  分类准确率  法的分类  实验  代表  高密度  平均密度  训练集  类别  计算

A New Density - Based Method for Reducing the Amount of Training Samples in k- NN Text Classification
Abstract:
Keywords:
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机系统应用》浏览原始摘要信息
点击此处可从《计算机系统应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号