一种新的基于密度的k-最近邻文本分类器训练样本约减方法 |
| |
引用本文: | 徐义峰,陈春明,徐云青.一种新的基于密度的k-最近邻文本分类器训练样本约减方法[J].计算机系统应用,2007,16(11):127-128. |
| |
作者姓名: | 徐义峰 陈春明 徐云青 |
| |
作者单位: | 1. 衢州学院信息与电子工程系,浙江衢州,324000 2. 桂林电子科技大学图书馆,广西桂林,541004 |
| |
摘 要: | 本文针对k-最近邻方法分类效率不高的问题,提出了一种基于密度的训练样本集约减算法.该方法通过计算训练样本集中各类别的类别密度及整个训练集的平均密度,去掉高密度类别中的部分样本,使训练样本集具有更好的代表性.实验表明,该方法不仅提高了k-最近邻方法的分类效率,而且对其分类准确率也有一定程度的提高.
|
关 键 词: | 文本分类 k-最近邻方法 训练样本 基于密度 最近邻 文本分类器 训练样本集 约减算法 方法分类 Text Classification Training Method Based 程度 分类准确率 法的分类 实验 代表 高密度 平均密度 训练集 类别 计算 |
A New Density - Based Method for Reducing the Amount of Training Samples in k- NN Text Classification |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
| 点击此处可从《计算机系统应用》浏览原始摘要信息 |
|
点击此处可从《计算机系统应用》下载全文 |
|