首页 | 本学科首页   官方微博 | 高级检索  
     

基于文本分类技术的垃圾邮件识别系统
引用本文:李国栋,李卫.基于文本分类技术的垃圾邮件识别系统[J].微电子学与计算机,2004,21(6):145-146,193.
作者姓名:李国栋  李卫
作者单位:西安交通大学电信学院,陕西,西安,710049
基金项目:国家自然科学基金项目(59937150),国家863计划项目(2001AA413910)
摘    要:文章介绍了一个基于文本分类技术识别垃圾邮件系统的体系结构,并介绍了该系统涉及到的中文信息处理、文本特征选取、朴素贝叶斯分类器等关键技术。最后,文章给出了针对部分垃圾邮件的处理结果。结果表明,该方法对于垃圾邮件的识别,具有较好的效果。

关 键 词:垃圾邮件  文本分类  汉语切词  朴素贝叶斯
文章编号:1000-7180(2004)06-145-02

A Recognition System of Spam Based on Text Classification Technology
LI Guo-dong,LI Wei.A Recognition System of Spam Based on Text Classification Technology[J].Microelectronics & Computer,2004,21(6):145-146,193.
Authors:LI Guo-dong  LI Wei
Abstract:This paper mainly describes the architecture of the recognition system of spam based on text classification technology. In addition, some related key technologies, such as Chinese information processing, text characteristic choicing and classifier of native Bayes are introduced. Finally, this paper provide the result of the processing on part of Spam. It shows that this method is quite useful for identifying mail Spam.
Keywords:Spam  Text Classification  Word Segmentation of Chinese  Native Bayes
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号