首页 | 本学科首页   官方微博 | 高级检索  
     

改进的朴素贝叶斯垃圾邮件过滤算法
引用本文:翟军昌,秦玉平,王春立. 改进的朴素贝叶斯垃圾邮件过滤算法[J]. 计算机工程与应用, 2009, 45(14): 145-148. DOI: 10.3778/j.issn.1002-8331.2009.14.044
作者姓名:翟军昌  秦玉平  王春立
作者单位:渤海大学,公共计算机教研部,辽宁,锦州,121000;渤海大学,信息科学与工程学院,辽宁,锦州,121000;渤海大学,信息科学与工程学院,辽宁,锦州,121000;大连海事大学,计算机科学与技术学院,辽宁,大连,116023
基金项目:国家自然科学基金,辽宁省教育厅资助科研课题 
摘    要:介绍了朴素贝叶斯垃圾邮件过滤算法,对于朴素贝叶斯算法中条件概率的计算,选用了多变量贝努里事件模型的计算方法,在多变量贝努里事件模型的基础上进行了改进,并在Ling-Spam语料库上进行实验,实验结果表明改进后的算法有效地提高了过滤器的召回率和精确率,并且降低了过滤器的错误率。

关 键 词:垃圾邮件  朴素贝叶斯  信息增益  多变量贝努里事件模型
收稿时间:2008-11-03
修稿时间:2009-1-15 

Improved Naïve Bayesian spam filtering algorithm
ZHAI Jun-chang,QIN Yu-ping,WANG Chun-li. Improved Naïve Bayesian spam filtering algorithm[J]. Computer Engineering and Applications, 2009, 45(14): 145-148. DOI: 10.3778/j.issn.1002-8331.2009.14.044
Authors:ZHAI Jun-chang  QIN Yu-ping  WANG Chun-li
Affiliation:1.Dept. of Public Computer Teaching & Research,Bohai University,Jinzhou,Liaoning 121000,China 2.College of Information Science and Technology,Bohai University,Jinzhou,Liaoning 121000,China 3.School of Computer Science and Technology,Dalian Maritime University,Dalian,Liaoning 116023,China
Abstract:The paper describes the Naïve Bayesian spam filtering algorithms.In terms of probability calculation of Naïve Bayes algorithm,the paper selects calculation of multi-variable model of Bernoulli event,and makes improvements to multi-variable model of Bernoulli event,and carries out an experimental on the Ling-Spam corpus.The results show that the improved algorithm can effectively enhance the recall and accuracy of the filter and lower the error rate of the filter.
Keywords:spam email  Naï  ve Bayes  information gain  multi-variable model of Bernoulli events
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号