首页 | 本学科首页   官方微博 | 高级检索  
     

基于贝叶斯分类的邮件过滤方法及模型研究
引用本文:肖旻,刘晓璐,屠立忠.基于贝叶斯分类的邮件过滤方法及模型研究[J].南京师范大学学报,2006,6(2):86-89.
作者姓名:肖旻  刘晓璐  屠立忠
作者单位:东南大学计算机科学与工程系,南京工程学院计算机工程系,南京工程学院计算机工程系 江苏 南京 210096 南京工程学院计算机工程系,江苏 南京 210013,江苏 南京 210013,江苏 南京 210013
基金项目:南京工程学院校科研和教改项目
摘    要:垃圾邮件日益泛滥,给用户带来了极大的不便和危害.并对网络安全构成威胁.传统邮件过滤方法单一,过滤精度不高,已不能很好地满足需求.结合规则过滤技术,分析了基于文本内容的贝叶斯分类器实现的关键技术与方法,并给出核心过滤算法在邮件分类中的实现具体方法及过程,进而完成垃圾邮件的判别.为减少邮件的误判对用户造成的损害及垃圾邮件漏判造成的影响,提出相应的改进措施,使用最小风险贝叶斯决策减小误判率,对分类系统经训练部分进行自适应调整,最后给出基于规则与内容的双重防范机制的邮件过滤模型及基于该框架的邮件判别流程.

关 键 词:邮件过滤  贝叶斯原理  文本分类  向量空间模型
文章编号:1672-1292(2006)02-0086-04
收稿时间:2005-09-28
修稿时间:2005年9月28日

Research in a Method and Model of Spam Filtering based on Bayesian Classifier
XIAO Min,LIU Xiaolu,TU Lizhong.Research in a Method and Model of Spam Filtering based on Bayesian Classifier[J].Journal of Nanjing Nor Univ: Eng and Technol,2006,6(2):86-89.
Authors:XIAO Min  LIU Xiaolu  TU Lizhong
Abstract:The increasing junk mail brings great inconvenience and danger to people, threatens the safety of the network. The filtering way is single used by traditional filters, can't well satisfy the demand of filtering. This paper has analysed the key techniques and methods about Bayesian classifier of content-based, provided the effective way and process of kernelly arithmetic in filtering and completed the judgment of spam. In order to reducing the damages because of mistaking e-mail, we provide the improved methods of using the risk minimization Bayesian decision and self-improvement of categorization system. The paper finally has described a spam filtering model and process by double defending based on rule and content.
Keywords:spam filter  Bayesian theory  text categorization  vector space model
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号