首页 | 本学科首页   官方微博 | 高级检索  
     

基于最优属性约简的中文邮件过滤系统
引用本文:李六杏,区凤霞.基于最优属性约简的中文邮件过滤系统[J].数字社区&智能家居,2007,1(5):1240-1241.
作者姓名:李六杏  区凤霞
作者单位:安徽行政学院 安徽合肥230031(李六杏),安徽中医学院 安徽合肥230031(区凤霞)
摘    要:对朴素贝叶斯理论作为中文邮件过滤技术进行了分析改进,邮件预处理后,对其进行分词处理,利用基于依赖性的粗糙集最优属性约简方法来对邮件集进行特征维数压缩。条件属性的数目大幅减少,提高了分类的效率。

关 键 词:垃圾邮件  中文分词  粗糙集  属性约简  贝叶斯分类器
文章编号:1009-3044(2007)05-11240-02
修稿时间:2007年1月17日

Filtering Spam System Based on the Dependent Rough Set Most Nature Reduction of Attributes
LI Liu-xing,OU Feng-xia.Filtering Spam System Based on the Dependent Rough Set Most Nature Reduction of Attributes[J].Digital Community & Smart Home,2007,1(5):1240-1241.
Authors:LI Liu-xing  OU Feng-xia
Affiliation:LI Liu-xing1,OU Feng-xia2
Abstract:This article has analyised the Bayesian theory and proposed a way of improving its filtering technique against Chinese mails.After pre-handling the mails. it will deal with them by phrases and then compress the characteristic dimension of the mail collection by using the reduction method of the best attribute of the dependent rough set. The number of the condition attributes reduces sharply,which thereby promotes the efficiency of classifying the mails.
Keywords:spam e-mail  phrasing in chinese  rough set  reduction of attributes  Bayesian classifier
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号