基于用户行为的邮件分类算法 |
| |
引用本文: | 陈治平,谭义红,赵碧海.基于用户行为的邮件分类算法[J].计算机应用,2014(5):1369-1372. |
| |
作者姓名: | 陈治平 谭义红 赵碧海 |
| |
摘 要: | 针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的邮件分类算法。通过分析朴素贝叶(NB)斯分类算法的原理,改造朴素贝叶斯算法,使其具有动态调整能力。邮件服务器接收到新邮件后自动进行分类判别,用户浏览邮件的过程中对邮件进行操作,根据用户对错分邮件的处理自动将该邮件加入训练数据集,并动态更新相应特征的统计概率,使邮件分类算法能够依据用户对不同邮件的操作行为动态调整分类模型,以达到有效过滤垃圾邮件的目的。与常用的贝叶斯分类算法的实验比较表明在给定小样本集合进行训练的情况下,新算法对于垃圾邮件的识别率比传统的朴素贝叶斯方法、基于风险敏感的朴素贝叶斯方法等提高了10%,获得了较好的分类性能。
|
关 键 词: | 分类算法 垃圾邮件 朴素贝叶斯 个性化 分类精度 |
本文献已被 CNKI 等数据库收录! |
|