首页 | 本学科首页   官方微博 | 高级检索  
     

关于贝叶斯推理的垃圾邮件特征选择评估函数
引用本文:闫鹏,郑雪峰,李明祥,陈松华.关于贝叶斯推理的垃圾邮件特征选择评估函数[J].计算机工程与应用,2008,44(33):105-107.
作者姓名:闫鹏  郑雪峰  李明祥  陈松华
作者单位:1. 北京科技大学,信息工程学院,北京,100083;国家信息中心,北京,100045
2. 北京科技大学,信息工程学院,北京,100083
3. 国家信息中心,北京,100045
摘    要:在各种基于机器学习的垃圾邮件过滤系统中,特征选择是基础且非常关键的一个环节,它对整个系统的性能和效率都有直接的影响。通过对垃圾邮件特点的分析,提出了一种基于贝叶斯推理的特征选择评估函数方法。新方法运算开销较小,且能够区分出不同的特征词在体现垃圾邮件特征时所存在的差异性,因而在进行特征选择时较其它常用方法更具针对性,非常利于提高过滤系统的准确性和运行效率。

关 键 词:反垃圾邮件  机器学习  特征选择  贝叶斯推理
收稿时间:2007-12-19
修稿时间:2008-3-21  

Feature selection approach based on Bayes reasoning in anti-spam classifier
YAN Peng,ZHENG Xue-feng,LI Ming-xiang,CHEN Song-hua.Feature selection approach based on Bayes reasoning in anti-spam classifier[J].Computer Engineering and Applications,2008,44(33):105-107.
Authors:YAN Peng  ZHENG Xue-feng  LI Ming-xiang  CHEN Song-hua
Affiliation:1.Information Engineering School of University Science and Technology Beijing,Beijing 100083,China 2.The State Information Center,Beijing 100045,China
Abstract:FS(Feature Selection) is a basal but crucial step within anti-spam classifiers based on ML(Machine Learning) algorithms.Nowadays FS based on Mutual Information(MI) is widely used.In this paper,by analyzing characteristic of spam emails,a new FS approach based on Bayes reasoning is presented.Experiments show that it can achieve much higher performance and efficiency than MI approach.
Keywords:anti-spam  machine learning  Bayes reasoning  feature selection
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机工程与应用》浏览原始摘要信息
点击此处可从《计算机工程与应用》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号