首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于嵌入式特征选择的垃圾邮件过滤模型
引用本文:闫鹏,郑雪峰,朱建勇,肖赟泓.一种基于嵌入式特征选择的垃圾邮件过滤模型[J].小型微型计算机系统,2009,30(8).
作者姓名:闫鹏  郑雪峰  朱建勇  肖赟泓
作者单位:1. 北京科技大学,信息工程学院,北京,100083;国家信息中心,北京,100045
2. 北京科技大学,信息工程学院,北京,100083
3. 国家信息中心,北京,100045
4. 北京科技大学,信息工程学院,北京,100083;北京市公安局,北京,100011
基金项目:国家"八六三"高技术研究发展计划基金项目 
摘    要:垃圾邮件自身的特点决定了消极学习型的文本分类算法更加适合于垃圾邮件过滤问题.但是,以k-NN为代表的消极型文本分类算法却存在着运行效率偏低等诸多缺点,不便于实际使用.为此,该文在向量余弦相似性公式的基础上,提出了一种新的"嵌入式特征选择垃圾邮件过滤模型"和基于此模型的消极学习型垃圾邮件过滤算法.与一些经典算法相比,新算法在显著降低运算开销的同时,巧妙地避免了由此而引起的信息丢失问题,因而在性能与效率两个方面都有明显提高,具有非常高的实际价值.

关 键 词:垃圾邮件过滤  机器学习  余弦相似性  嵌入式特征选择

Lazy Learning Spam Filtering Model Based on Embedded Feature Selection
YAN Peng,ZHENG Xue-feng,ZHU Jian-yong,XIAO Yun-hong.Lazy Learning Spam Filtering Model Based on Embedded Feature Selection[J].Mini-micro Systems,2009,30(8).
Authors:YAN Peng  ZHENG Xue-feng  ZHU Jian-yong  XIAO Yun-hong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号