首页 | 本学科首页   官方微博 | 高级检索  
     

邮件过滤算法的比较
引用本文:李文斌,陈嶷瑛,刘椿年,刘泰峰.邮件过滤算法的比较[J].计算机工程与设计,2008,29(17).
作者姓名:李文斌  陈嶷瑛  刘椿年  刘泰峰
作者单位:1. 石家庄经济学院,信息工程学院,河北,石家庄,050031
2. 石家庄经济学院,信息工程学院,河北,石家庄,050031;中国矿业大学,北京,100083
3. 北京工业大学计算机学院,北京,100022
基金项目:河北省科技厅科研项目,石家庄经济学院重点基金
摘    要:探讨了邮件过滤器的体系,介绍了6种常用的过滤算法.在4个公用的数据集上,利用3个评价指标对这6种算法进行了全面的比较.实验的主要结论有:集成过滤器的方法有利于提高过滤效果;与其它两个数据集相比,PU1和Ling-spam数据集用于评价过滤器时会得出相对乐观的结果;NB和k-NN的表现不稳定,对数据集的敏感程度较高.对于邮件过滤研究者了解、改进已有算法,提出新的算法有一定的参考价值.

关 键 词:邮件过滤  电子邮件  过滤体系  垃圾电子邮件  数据挖掘

Comparative study on email filtering algorithms
LI Wen-bin,CHEN Yi-ying,LIU Chun-nian,LIU Tai-feng.Comparative study on email filtering algorithms[J].Computer Engineering and Design,2008,29(17).
Authors:LI Wen-bin  CHEN Yi-ying  LIU Chun-nian  LIU Tai-feng
Affiliation:LI Wen-bin1,CHEN Yi-ying1,3,LIU Chun-nian2,LIU Tai-feng1(1.School of Information Engineering,Shijiazhuang University of Economics,Shijiazhuang 050031,China,2.School of Computer Science,Beijing University of Technology,Beijing 100022,3.China University of Mining of Technology,Beijing 100083,China)
Abstract:The architecture of email filters is given,and six algorithms for blocking spam is introduced.On four public available datasets,we do a full comparative study on the six algorithms by using three evaluation criteria.The main conclusions drawn from the experimental results are firstly that combing multiple filters can gain better performance than a single filter.Secondly,comparing with other two datasets,on PU1 and Ling-spam,a filter shows more optimistical results.The performance of NB and k-NN is greatly d...
Keywords:email filtering  email  filtering architecture  spam  data mining  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号