首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
垃圾邮件的综合过滤方法   总被引:10,自引:1,他引:9  
徐激  龚俭 《计算机科学》2005,32(2):69-72
本文研完了几种常用的垃圾邮件过滤算法,分析了它们在中文邮件环境中存在的问题。本文根据各算法的优缺点,将它们进行改进、叠加和相互结合,并通过查看发出的邮件内容进行辅助学习,从而建立一个垃圾邮件的综合过滤方法。文章最后对该综合方法的效率做了分析和比较。  相似文献   

2.
基于免疫原理的个性化Spam过滤算法   总被引:2,自引:0,他引:2  
受生物免疫系统工作机制的启发,本文提出一种基于免疫原理的个性化Spam过滤算法.其主要思想是根据用户兴趣和邮件特征定义垃圾邮件社区,将各垃圾邮件归类于不同的垃圾邮件社区,抽取各个垃圾邮件社区的特征并用一组特征检测器来表示,检测时通过判断待检测邮件是否归属于某垃圾邮件社区来进行过滤.该算法是一个增量学习算法,能连续过滤垃圾邮件.算法中免疫学习与免疫记忆机制的采用不仅能提高垃圾邮件过滤的检出率与正确率还能加快邮件过滤的速度.文中通过测试实验和分析表明,本文算法的垃圾邮件过滤性能优于AISEC与Naive Bayesian算法.  相似文献   

3.
本文分析了目前在垃圾邮件过滤中广泛应用的朴素贝叶斯过滤算法及其优缺点,并且根据模式匹配和模糊匹配算法提出改进型的贝叶斯邮件过滤模型。首先在邮件预处理过程中进行特征项的提取——模式匹配,从训练集合中识别出正常邮件和垃圾邮件的模式集合,然后用模式集合识别垃圾邮件,再对提取出的特征项进行模糊匹配并根据匹配结果判断邮件是否为垃圾邮件。实验结果表明:应用改进后的算法有效地提高了垃圾邮件过滤的准确率。  相似文献   

4.
基于自学习K近邻的垃圾邮件过滤算法   总被引:5,自引:0,他引:5  
针对现有垃圾邮件过滤算法所存在的训练样本与测试样本分布不一致而导致实际应用效果比较差的现象,提出了一种基于自学习K近邻(k nearest neighbors,KNN)方法的垃圾邮件过滤算法.应用KNN方法对未知邮件样本进行精确匹配,以排除合法邮件的误判结果,同时结合用户对垃圾邮件的处理,自动调整训练集合.实验表明算法具有较好的过滤性能.  相似文献   

5.
分层垃圾邮件过滤器的设计与实现   总被引:1,自引:0,他引:1  
由于垃圾邮件变化多端,日益泛滥,传统的、单一的反垃圾邮件方法对新型的垃圾邮件已经无能为力,为了攻克这一难题,我们设计了一个包含贝叶斯算法、反向DNS查询以及系统级和用户级过滤等的分层反垃圾邮件技术的邮件服务器.该服务器除了能收发邮件、过滤邮件,还可以通过自动和手动两种方式进行学习,以适应垃圾邮件的变化,有效的屏蔽垃圾邮件.本文着重介绍该服务器的垃圾过滤器所采用的各种技术和主要结构.  相似文献   

6.
邓维斌  洪智勇 《计算机应用》2010,30(8):2006-2009
如何将邮件的头信息和内容信息有效结合起来进行垃圾邮件过滤备受研究人员的关注。基于粗糙集具有很好地处理不确定信息的特点,提出了一种基于粗糙集的两阶段邮件过滤方法,首先根据邮件头信息将其分为正常邮件、垃圾邮件和可疑邮件,再根据邮件内容将可疑邮件分为正常和垃圾邮件。通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法不仅能提高垃圾邮件过滤的准确率,而且能大幅降低误杀率。  相似文献   

7.
垃圾邮件对计算机系统的安全和人们的生活造成了严重的威胁,反垃圾邮件问题已经成为的具有重要现实意义的研究课题.针对垃圾邮件过滤本质是分类问题,提出了一种基于服务器前端的反垃圾邮件过滤方法,它采用了改进的v支持向量机算法对邮件内容进行分类,过滤垃圾邮件.研究结果表明该方法与直接的支持向量机增量算法相比,提高了过滤的准确率,具有一定的应用价值.  相似文献   

8.
研究探讨了传统贝叶斯模型的原理和优缺点,指出朴素贝叶斯算法没有考虑到合法邮件和垃圾邮件被误判带来的不同损失.针对个人用户的个性化需求,以朴素贝叶斯算法为基础,结合最小风险,提出改进的基于垃圾单词的单一表文件垃圾邮件过滤算法,给出其具体实现方法及过程,并且通过实验证明其可行性.最后综合黑白名单、规则过滤和文本内容分类过滤三级模式构建了邮件过滤模型.  相似文献   

9.
介绍现在普遍采用的几种垃圾邮件过滤方法,对基于内容的过滤方法中的贝叶斯算法和Winnow算法进行详细的介绍.目前研究中文垃圾邮件的各类文献都基于不同的语料库,缺乏算法之间的效果比较分析.分别实现贝叶斯和Winnow的改进算法,并对CCERT的一个公开邮件语料库进行测试.测试结果表明,两种算法都达到较好的过滤效果.  相似文献   

10.
基于粗糙集的加权朴素贝叶斯邮件过滤方法   总被引:5,自引:3,他引:2  
邮件过滤中有两个关键问题,一是如何选择有效的邮件特征集,二是设计较好的邮件过滤算法。在对邮件特性进行分析的基础上,综合邮件头及邮件内容的主要形象特征给出了一种新的邮件特征集提取方法。用粗糙集的信息观点度量了各属性的重要性,并以此为权重进行加权朴素贝叶斯垃圾邮件过滤,有效地解决了朴素贝叶斯分类中的条件依赖性问题。通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法的有效性。  相似文献   

11.
垃圾邮件的智能过滤系统设计探讨   总被引:8,自引:0,他引:8  
Internet的迅速发展,电子邮件的应用变得十分广泛,但是许多无用、有害信息随之而来。通过对垃圾邮件的分析、处理,设计了"基于用户个性化兴趣"的垃圾邮件智能过滤概念系统,首次提出将邮件向量同规则向量统一定义,有选择地进行二次过滤等理论。功能设计完善,证明了其思想优于目前的某些主流邮件过滤系统。  相似文献   

12.
电子邮件给我们的生活带来了极大的便利,但是许多无用的信息也随之而来。贝叶斯算法是一种基于内容的垃圾邮件过滤方法,文章首先给出了其应用原理,接着分析了其相比于其他过滤方法的优缺点,特别是其用于处理中文垃圾邮件时的不足之处。最后提出了一些改进措施及发展方向。  相似文献   

13.
综合分析了垃圾邮件过滤的技术路线与方法,并在分析基于关键字的方法和统计学的方法的基础上,提出了将两者相结合,运用模式识别中的贝叶斯、最近邻和感知机等分类方法,实现对垃圾邮件的过滤的技术路线。以互信息最大化准则筛选出的特征集为基础,对不同分类技术的对比分析揭示了贝叶斯、最近邻和感知机在垃圾邮件过滤应用上的优劣。同时,文中对基于互信息最大化准则的垃圾邮件过滤应用提出了有益的思路。  相似文献   

14.
结合邮件的半结构化特征,将最大熵模型引入垃圾邮件过滤中,构造出基于最大熵模型的垃圾邮件过滤系统框架.在此基础上,将其与Outlook提供的PIA相结合,利用.NET技术开发出基于最大熵模型的垃圾邮件过滤插件,在客户端实现了基于内容的垃圾邮件过滤,较好地解决了垃圾邮件的问题.  相似文献   

15.
图像型垃圾邮件过滤技术研究综述   总被引:1,自引:1,他引:0  
首先概述了图像型垃圾邮件的基本概念;其次根据不同的标准对图像型垃圾邮件过滤技术进行了分类,并评述了各种图像型垃圾邮件过滤方法和技术;对已经用于图像型垃圾邮件分类的两类共五种分类算法进行了理论分析与效果比较;最后对图像型垃圾邮件过滤技术的研究方向进行了展望.  相似文献   

16.
本文在对中文邮件关键词提取方法、关键词的降维处理与优化提炼以及垃圾邮件识别概率等方面进行理论探讨的同时,较为详细地阐述了中文环境下贝叶斯过滤技术的使用方法,这对有效减少垃圾邮件数量,提高网络利用率具有重要的理论价值和现实意义。  相似文献   

17.
垃圾邮件过滤系统的研究与实现   总被引:4,自引:0,他引:4  
张羿  周建国  晏蒲柳 《计算机工程》2006,32(18):106-108
介绍了各类垃圾邮件过滤技术,分析了已经应用于垃圾邮件内容过滤领域的一些分类算法存在的某些不足,创新地将一种新的分类算法(SECTILE)应用于垃圾邮件的分类过滤中去,并设计了一个多层次垃圾邮件过滤系统。该系统整合了多项垃圾邮件过滤技术(黑名单/白名单技术、基于规则的过滤、基于内容的过滤),实验和分析结果表明,该系统提高了垃圾邮件过滤的效率和准确性。  相似文献   

18.
分析邮件特征对邮件分类的影响,提出了双层分类方法并用于邮件服务智能代理.它包括邮件长度分类、邮件采集与预处理、文本分词、特征选取和邮件分类器等功能模块.此代理不仅可使邮件服务器具有自动过滤垃圾邮件的能力,也可以用于电子政务和电子商务,对邮件自动分类和转发.该双层分类方法首先对邮件按长度进行分类,然后根据邮件的不同长度类分别使用不同的贝叶斯分类器,从而实现垃圾邮件的过滤.实验表明它有效地提高了邮件分类的效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号