首页 | 本学科首页   官方微博 | 高级检索  
     

基于差分贡献的垃圾邮件过滤特征选择方法
引用本文:张文良,黄亚楼,倪维健. 基于差分贡献的垃圾邮件过滤特征选择方法[J]. 计算机工程, 2007, 33(8): 80-82
作者姓名:张文良  黄亚楼  倪维健
作者单位:南开大学软件学院,天津,300071;南开大学软件学院,天津,300071;南开大学软件学院,天津,300071
摘    要:垃圾邮件过滤本质上是一个二类文本分类问题,特征选择是其一个重要的组成部分。针对垃圾邮件过滤问题的特殊性,基于“差分贡献”的思想对文档频数和互信息量这两种传统的特征选择方法进行了改进,设计了新的垃圾邮件过滤特征选择方法。实验结果表明,基于差分贡献的特征选择方法使得垃圾邮件过滤的精度得到了有效的提高。

关 键 词:垃圾邮件过滤  特征选择  文档频数  互信息量
文章编号:1000-3428(2007)08-0080-03
修稿时间:2006-04-25

Approach to Feature Selection of Spam Filtering Based on Contribution Difference
ZHANG Wenliang,HUANG Yalou,NI Weijian. Approach to Feature Selection of Spam Filtering Based on Contribution Difference[J]. Computer Engineering, 2007, 33(8): 80-82
Authors:ZHANG Wenliang  HUANG Yalou  NI Weijian
Affiliation:College of Software, Nankai University, Tianjin 300071
Abstract:Spam filtering is essentially a two-category text classification problem.Feature selection plays an important role in spam filtering.For the peculiarity of the two-category classification problem,improvement on traditional feature-selection approaches can be made.Based on the idea of "contribution difference",improvement on two traditional feature selection approaches,i.e,document frequency and mutual information is made.The experiment results show that the new approach significantly improve classification precisions.
Keywords:Spam filtering   Feature selection   Document frequency   Mutual information
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机工程》浏览原始摘要信息
点击此处可从《计算机工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号