首页 | 本学科首页   官方微博 | 高级检索  
     

邮件过滤中特征选择算法的研究及改进
引用本文:卢扬竹,张新有,祁玉. 邮件过滤中特征选择算法的研究及改进[J]. 计算机应用, 2009, 29(10)
作者姓名:卢扬竹  张新有  祁玉
作者单位:西南交通大学,信息科学与技术学院,成都,610031;西南交通大学,信息科学与技术学院,成都,610031;西南交通大学,信息科学与技术学院,成都,610031
摘    要:对基于内容的垃圾邮件过滤技术尤其是特征选择算法进行了研究.在此基础上,对其中的互信息算法进行了分析,并将其与邮件过滤的特点结合起来进行,在频度、集中度及分散度三个指标上进行改进,在原互信息算法已考虑分散度的基础上,引入词频来表征频度,以类别贡献比来衡量特征对分类的贡献,即表征集中度,并给出了改进后的互信息计算公式及算法.最后使用真实邮件训练集进行了邮件分类的实验,实验结果证明对互信息算法的改进能有效提高邮件分类性能.

关 键 词:垃圾邮件  文本分类  特征选择  互信息

Improvement of feature selection method in spam filtering
LU Yang-zhu,ZHANG Xin-you,QI Yu. Improvement of feature selection method in spam filtering[J]. Journal of Computer Applications, 2009, 29(10)
Authors:LU Yang-zhu  ZHANG Xin-you  QI Yu
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号