首页 | 本学科首页   官方微博 | 高级检索  
     

基于KNN的Web文本分类方法的研究
引用本文:牛强,王志晓,陈岱,夏士雄.基于KNN的Web文本分类方法的研究[J].计算机应用与软件,2007,24(10):210-211.
作者姓名:牛强  王志晓  陈岱  夏士雄
作者单位:中国矿业大学计算机科学与技术学院,江苏,徐州,221008
摘    要:为了更有效地组织Internet 上丰富的信息资源, 通过分析Web 文本的特点,提出了基于KNN 的Web文本分类方法,并结合具体实验在对数据进行预处理的基础上实现了KNN分类算法.实验表明,该方法训练数据规模大大减少,训练效率较高,同时具有较好的精确率和召回率.

关 键 词:KNN算法  特征提取  Web文本  文本分类  文本  分类方法  研究  BASED  DOCUMENT  CLASSIFICATION  召回率  精确率  训练效率  数据规模  方法训练  分类算法  预处理  实验  结合  分析  信息资源  Internet  组织
修稿时间:2006-02-22

STUDY ON WEB DOCUMENT CLASSIFICATION BASED ON KNN
Niu Qiang,Wang Zhixiao,Chen Dai,Xia Shixiong.STUDY ON WEB DOCUMENT CLASSIFICATION BASED ON KNN[J].Computer Applications and Software,2007,24(10):210-211.
Authors:Niu Qiang  Wang Zhixiao  Chen Dai  Xia Shixiong
Abstract:Based on the analyses of features of Web documents,a Web document classification algorithm based on KNN is presented to effectively organize the rich information on the Internet.Based on data preprocess,KNN neighbor algorithm is implemented.The experiments show that the algorithm not only reduces the size of train set,but also has very high training efficiency,good precision and recall as well.
Keywords:KNN Feature selection Web documents Text classification
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号