首页 | 本学科首页   官方微博 | 高级检索  
     

基于模糊聚类和Naive Bayes方法的文本分类器
引用本文:杨岳湘,田艳芳,王韶红.基于模糊聚类和Naive Bayes方法的文本分类器[J].计算机工程与科学,2002,24(5):18-21.
作者姓名:杨岳湘  田艳芳  王韶红
作者单位:国防科技大学计算机学院,湖南长沙410073
摘    要:本文提出一种文本分类的新方法,该方法将模糊聚类与基于Naive Bayes的EM分类算法相结合,从而大大提高了EM分类算法的准确性,并解决了使用字符匹配引起的不完整性和不准确性问题。该方法首先给出每个类的一些关键词,并把这些关键词作为聚类中心进行聚类,然后使用距离聚类中心较近的文档启动一个引导过程。

关 键 词:模糊聚类  Naive  Bayes方法  文本分类器  聚类中心  神经网络
文章编号:1007-130X(2002)05-0018-04
修稿时间:2002年3月18日

A Text Classifier Based on Fuzzy Clustering and the Naive Bayes Method
YANG Yue xiang,TIAN Yan fang,WANG Shao hong.A Text Classifier Based on Fuzzy Clustering and the Naive Bayes Method[J].Computer Engineering & Science,2002,24(5):18-21.
Authors:YANG Yue xiang  TIAN Yan fang  WANG Shao hong
Abstract:This paper presents a new method which combines fuzzy clustering and the Naive Bayes based EM classification algorithm.The new method improves the exactness of the algorithm and solves the problems of incompletion and inaccuracy of using term matching. First, someof each class are given and regarded as clustering centers. Then, a bootstrapping process using the texts which have a shorter distance to the centers is started and used to train a EM classifier
Keywords:Naive Bayes classifier  text classi
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号