首页 | 本学科首页   官方微博 | 高级检索  
     

层次式文本分类的Na(i)ve Bayes改进方法
引用本文:张博锋,苏金树,徐昕. 层次式文本分类的Na(i)ve Bayes改进方法[J]. 计算机工程与科学, 2008, 30(4): 20-22
作者姓名:张博锋  苏金树  徐昕
作者单位:国防科技大学计算机学院,湖南,长沙,410073;国防科技大学计算机学院,湖南,长沙,410073;国防科技大学机电工程与自动化学院,湖南,长沙,410073
基金项目:国家自然科学基金 , 高等学校博士学科点专项科研项目
摘    要:Naive Bayes方法在文本分类中的决策强烈依赖于主观选择的样本关于类别的分布。本文利用层次式分类的特点并引入概率条件改进Naive Bayes方法,使其在每个内部类别所属的子类局部数据中进行决策,缓解了全局数据分布对分类器的影响,部分克服了数据偏斜问题。实验表明,改进方法在层次式分类中的效果较Naive Bayes方法有显著提高

关 键 词:文本分类  层次式分类  Na(i)ve Bayes  机器学习  数据偏斜
文章编号:1007-130X(2008)04-0020-03
修稿时间:2006-11-02

An Enhanced Na(i)ve Bayes Method for Hierarchical Text Classification
ZHANG Bo-feng,SU Jin-shu,XU Xin. An Enhanced Na(i)ve Bayes Method for Hierarchical Text Classification[J]. Computer Engineering & Science, 2008, 30(4): 20-22
Authors:ZHANG Bo-feng  SU Jin-shu  XU Xin
Abstract:The text categorization method of Naive Bayes, which highly depends on the subjectively-selected sample distribution with respect to classes, is enhan ced by using the characteristics of hierarchical classification and introducing the conditional probability. The enhancement makes decisions in the loca l data which belong to the sub-classes of an internal class to lighten the influence of global data distribution, and partially overcomes the problem ofdata skewness. Experiments show the enhanced method improves the effectiveness of hierarchical categorization with the Naive Bayes method notably.
Keywords:text categorization  hierarchical categorization  Naive Bayes  machine learning  data skewness
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与科学》浏览原始摘要信息
点击此处可从《计算机工程与科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号