首页 | 本学科首页   官方微博 | 高级检索  
     

中文文本分类系统的设计与实现
引用本文:王俊英,郭景峰,霍峥. 中文文本分类系统的设计与实现[J]. 微电子学与计算机, 2006, 23(Z1): 262-265
作者姓名:王俊英  郭景峰  霍峥
作者单位:燕山大学,信息科学与工程学院,河北,秦皇岛,066004
摘    要:文章介绍了中文文本分类系统的基本过程及其关键技术,比较和分析Rocchio、朴素贝叶斯(NB)、kNN三种文本分类算法的分类原理,提出了中文文本分类系统的结构模型,并给出了评估方法和实验结果,测试结果表明KNN算法的分类效果最佳。

关 键 词:文本分类  向量空间模型  特征项选择  权重
文章编号:1000-7180(2006)S0-0262-04
修稿时间:2006-04-15

Design and Implementation of Chinese Text Categorization System
WANG Jun-ying,GUO Jing-feng,HUO Zheng. Design and Implementation of Chinese Text Categorization System[J]. Microelectronics & Computer, 2006, 23(Z1): 262-265
Authors:WANG Jun-ying  GUO Jing-feng  HUO Zheng
Abstract:This Paper introduces the techniques and basic process of Chinese text categorization system, compares and analyses the algorithms of Text Categorization, the theories and technologies such as Rocchio, NB, and kNN. It also describes a text categorization model of Chinese, and gives the evaluations and results. The experiment results have proved that classification results of kNN algorithms are best.
Keywords:Text categorization   Vector space model   Feature selection   Weight  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号