首页 | 官方网站   微博 | 高级检索  
     

改进的朴素贝叶斯垃圾邮件过滤算法
引用本文:翟军昌,秦玉平,王春立.改进的朴素贝叶斯垃圾邮件过滤算法[J].计算机工程与应用,2009,45(14):145-148.
作者姓名:翟军昌  秦玉平  王春立
作者单位:1.渤海大学 公共计算机教研部,辽宁 锦州 121000 2.渤海大学 信息科学与工程学院,辽宁 锦州 121000 3.大连海事大学 计算机科学与技术学院,辽宁 大连 116023
基金项目:国家自然科学基金,辽宁省教育厅资助科研课题 
摘    要:介绍了朴素贝叶斯垃圾邮件过滤算法,对于朴素贝叶斯算法中条件概率的计算,选用了多变量贝努里事件模型的计算方法,在多变量贝努里事件模型的基础上进行了改进,并在Ling-Spam语料库上进行实验,实验结果表明改进后的算法有效地提高了过滤器的召回率和精确率,并且降低了过滤器的错误率。

关 键 词:垃圾邮件  朴素贝叶斯  信息增益  多变量贝努里事件模型
收稿时间:2008-11-3
修稿时间:2009-1-15  

Improved Naïve Bayesian spam filtering algorithm
ZHAI Jun-chang,QIN Yu-ping,WANG Chun-li.Improved Naïve Bayesian spam filtering algorithm[J].Computer Engineering and Applications,2009,45(14):145-148.
Authors:ZHAI Jun-chang  QIN Yu-ping  WANG Chun-li
Affiliation:1.Dept. of Public Computer Teaching & Research,Bohai University,Jinzhou,Liaoning 121000,China 2.College of Information Science and Technology,Bohai University,Jinzhou,Liaoning 121000,China 3.School of Computer Science and Technology,Dalian Maritime University,Dalian,Liaoning 116023,China
Abstract:The paper describes the Naïve Bayesian spam filtering algorithms.In terms of probability calculation of Naïve Bayes algorithm,the paper selects calculation of multi-variable model of Bernoulli event,and makes improvements to multi-variable model of Bernoulli event,and carries out an experimental on the Ling-Spam corpus.The results show that the improved algorithm can effectively enhance the recall and accuracy of the filter and lower the error rate of the filter.
Keywords:spam email  Naï  ve Bayes  information gain  multi-variable model of Bernoulli events
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号