首页 | 本学科首页   官方微博 | 高级检索  
     

一种新型朴素贝叶斯文本分类算法
引用本文:邸鹏,段利国.一种新型朴素贝叶斯文本分类算法[J].数据采集与处理,2014,29(1):71-75.
作者姓名:邸鹏  段利国
作者单位:太原理工大学计算机科学与技术学院
基金项目:国家重点实验室开放课题(SKLSE2012-09-30)资助项目;山西省自然科学基金(2013-011015-2)资助项目;太原理工大学“语言信息处理学科建设和研究”专项项目资助。
摘    要:针对在文本分类中先验概率的计算比较费时而且对分类效果影响不大、后验概率的精度损失影响分类准确率的现象,对经典朴素贝叶斯分类算法进行了改进,提出了一种“先抑后扬”(抑制先验概率的作用,扩大后验概率的影响)的文本分类算法。算法中去掉了对先验概率的计算,并在后验概率的计算中引入了一个放大系数。实验结果表明,分类时不计算先验概率对分类精度影响甚微但可以明显加快分类的速度,在后验概率的计算中引入放大系数减少了误差传播的影响,提高了分类精度。

关 键 词:文本分类  朴素贝叶斯  先验概率  后验概率

New Naice Bayes Text Classification Algorithm
Di Peng,Duan Liguo.New Naice Bayes Text Classification Algorithm[J].Journal of Data Acquisition & Processing,2014,29(1):71-75.
Authors:Di Peng  Duan Liguo
Abstract:
Keywords:text categorization  naive Bayes  prior probability  posterior probability
点击此处可从《数据采集与处理》浏览原始摘要信息
点击此处可从《数据采集与处理》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号