首页 | 本学科首页   官方微博 | 高级检索  
     

KNN-SVM网页分类器介绍
引用本文:魏梦娟,罗文龙.KNN-SVM网页分类器介绍[J].现代计算机,2008(7).
作者姓名:魏梦娟  罗文龙
作者单位:[1]广州市统计局计算中心,广州510030 [2]中山大学数学与计算科学学院,广州510275
摘    要:网页分类算法中,KNN算法的缺陷之一是分类效率较低,分类的效果很大程度上依赖于相似度函数和参敷K的选择.同时,基于支持向量机(SVM)网页分类器的限制在于要求处理的向量是数值型向量,而网页特征向量往往是词条特征向量.利用KNN算法生成训练样本,进而将词务特征向量数值化,再利用支持向量机分类器对测试网页进行分类,构建了一种新的分类器--KNN-SVM分类器.

关 键 词:词务特征向量  数值化

Introduction of KNN-SVM Page Classifier
WEI Meng-juan,LUO Wen-long.Introduction of KNN-SVM Page Classifier[J].Modem Computer,2008(7).
Authors:WEI Meng-juan  LUO Wen-long
Affiliation:WEI Meng-juan1,LUO Wen-long2 (1. Computer Center,Statistics Bureau of Guangzhou,Guangzhou 510030,2. School of Mathematics , Computational Science,SUN Yat-sen University,Guangzhou 510275)
Abstract:In all kind of methods of web page classifications, KNN's efficiency is not good enough, and the performance depends on the similarity function and the parameter K. Meanwhile, the limitation of SVM is the requirement of numeric vectors, but the feature vector of a page is often based on words. Through making use of KNN to generate training samples, and turns word vectors to numeric vectors, then uses SVM to finish the classification, so as to build a new classifier, KNN-SVM classifier.
Keywords:KNN  SVM
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号