首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 62 毫秒
1.
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。  相似文献   

2.
Lucene的最小风险概率加权朴素贝叶斯算法   总被引:1,自引:0,他引:1  
为了提高垃圾邮件过滤的准确性,在分析垃圾邮件数据的基础上,对比信息检索与信息过滤之间的关系,将信息检索框架Lucene应用到垃圾邮件过滤系统中,提出最小风险概率加权的朴素贝叶斯算法,与最小风险法结合,有效地减少贝叶斯方法的独立性约束.实验验证了加权朴素贝叶斯算法的有效性.  相似文献   

3.
为了提高电子邮件中垃圾邮件的过滤准确率和效率,以朴素贝叶斯算法和K最近邻(KNN:K-Nearest Neighbors)算法为基础,对传统垃圾邮件过滤算法进行改进,给出邮件的合法属性和非法属性的概念,并提出一种新的分类算法——基于邮件合法属性和非法属性的分类算法(SEASF:Simple and Efficient Algorithm to Spam Filter based on legitimate attribute and nonlicet attribute)。SEASF计算复杂度较低,可适用于大规模场合及邮件的在线过滤。将SEASF算法应用于垃圾邮件过滤的结果表明,该算法可大幅度提高分类精度,分类速度也令人满意。  相似文献   

4.
随着对垃圾邮件问题的普遍关注,针对目前邮件过滤方法中存在着的语义缺失现象和处理群发型垃圾邮件低效问题,提出一种基于潜在语义分析(LSA)和信息-摘要算法5(MD5)的垃圾邮件过滤模型。利用潜在语义分析标注垃圾邮件中潜在特征词,从而在过滤技术中引入语义分析;利用MD5在LSA分析基础上,对群发型垃圾邮件生成"邮件指纹",解决过滤技术在处理群发型垃圾邮件中低效的问题。结合该模型设计了一个垃圾邮件过滤系统。采用自选数据集对文中设计的系统进行测试评估,经与Naïve Bayes算法过滤器进行比较,证明该方法在垃圾邮件过滤上优于Naïve Bayes方法,实验结果达到了预期的效果,验证了该方法的可行性、优越性。  相似文献   

5.
基于朴素贝叶斯算法的垃圾邮件过滤器是目前比较高效、经济的垃圾邮件过滤技术之一,它已经广泛应用到垃圾邮件过滤领域。文章在对朴素贝叶斯过滤器分析的基础上,针对朴素贝叶斯算法的缺陷结合损失最小化的思想,并根据垃圾邮件的特性对朴素贝叶斯算法做了改进,提出了改进朴素贝叶斯算法,该算法能够通过调整k值,降低合法邮件被错判为垃圾邮件的概率,从而最大程度减少用户的损失。  相似文献   

6.
基于CS-SVM与Bagging的垃圾邮件过滤算法研究   总被引:1,自引:0,他引:1  
针对邮件过滤中正常邮件与垃圾邮件误分类代价的不对称性,提出了基于代价敏感支持向量机(CS-SVM)与Bagging的垃圾邮件过滤算法.通过对每个样本赋予不同的代价,利用最小化误分类代价来获得最优分类器,提高了垃圾邮件过滤的正确率.实验结果表明,该算法具有正确率高、能有效降低将正常邮件误判为垃圾邮件的比率等优点.  相似文献   

7.
针对垃圾邮件过滤过程中分类模型难以个性化、难以适应用户兴趣动态变化的问题,提出了一种基于用户行为的个性化邮件分类算法.算法通过分析朴素贝叶斯分类算法的原理,改造朴素贝叶斯的算法使其具有动态调整能力.实验结果表明此算法具有较高的分类精度.  相似文献   

8.
针对电子邮件系统中垃圾邮件引起的安全性问题,设计了一种邮件过滤系统模型。该模型采用CORBA/IIOP体系结构,在服务器端进行基于地址、内容的邮件过滤,其中内容过滤采用先进的潜在语义索引算法,并通过构建用户个性词典的方法解决了该算法中文档集用户兴趣有效性问题。  相似文献   

9.
垃圾邮件不仅浪费大量的网络资源,并且给用户带来很大的不便,如何有效地防范垃圾邮件,已成为网络信息安全领域的主要课题之一。本文通过对传统垃圾邮件过滤技术的分析,提出了一种基于指纹的定量过滤方法。对白名单和黑名单过滤、定时过滤、基于指纹的定量过滤和贝叶斯过滤技术进行了整合,建立了一种客户端垃圾邮件过滤系统的模型,该系统具有较高的过滤准确性,并且能适应用户的个性化需求。  相似文献   

10.
一种混合的垃圾邮件过滤算法研究   总被引:3,自引:0,他引:3  
贝叶斯邮件过滤器具有较强的分类能力,极高的准确率,在内容过滤领域占据主导地位。人工免疫系统具备强大的自学习、自适应,鲁棒性等能力,已发展成为计算智能研究的一个崭新的分支。该文在分析贝叶斯的原理和人工免疫的仿生机理的基础上,将贝叶斯与人工免疫相结合,设计和实现了一种基于贝叶斯和人工免疫的混合垃圾邮件过滤算法,并利用现有的垃圾邮件语料库得到预期的实验结果。  相似文献   

11.
分析了基于内容过滤的反垃圾邮件技术存在的不足,如概念漂移和偏斜类分布会导致召回率降低.在Minoru Sasaki和Hiroyuki Shinnou提出的邮件检测方法的基础上,对特征选择算法做了改进,并增加了自动学习机制,提出了一种基于改进K-均值聚类的垃圾邮件过滤算法.实验表明此方法能较好地适应概念漂移和偏斜类分布现象.  相似文献   

12.
基于贝叶斯过滤算法的反垃圾邮件策略   总被引:4,自引:0,他引:4  
结合传统贝叶斯算法的数学定理.给出了朴素贝叶斯过滤算法以及该算法在反垃圾邮件中的六个处理步骤,算法通过渐进学习的方式分别建立三个哈希表,并预置相应的阀值来判定收到的邮件是否为垃圾邮件.以实例方式说明了此算法为基础的反垃圾邮件策略,最后指出了朴素贝叶斯算法存在的问题及可能改进的方向,对防范和处理垃圾邮件提供理论依据和实践参考.  相似文献   

13.
贝叶斯网络在过滤垃圾邮件算法中的应用研究   总被引:2,自引:0,他引:2  
为在用户数据流中删除垃圾邮件,研究了具有自我学习能力的自适应邮件过滤系统.在对正常和垃圾2类邮件误分类成本分析的基础上,利用概率性的学习方法创建满足过滤任务需要的过滤器,且讨论使用邮件域名特征变量进行特定邮件过滤并设计了过滤器,最后对实际邮件组进行操作,验证了算法的可靠性.  相似文献   

14.
单一的垃圾邮件过滤技术已经不能有效阻止不断出现的新型垃圾邮件,基于多Agent技术结合现有垃圾邮件过滤技术建立一个多技术整合分层过滤的垃圾邮件过滤系统.该系统在服务器端主要对一些具有反动、色情和病毒特征的邮件进行强制过滤,在客户端可以根据用户的兴趣选择进行个性化过滤.  相似文献   

15.
伴随着电子邮件的广泛使用,垃圾邮件日益泛滥,严重影响了人们正常的工作、学习和生活。如今新型的垃圾邮件变化多端,使得传统的、单一的垃圾邮件过滤方法对新型垃圾邮件已经无能为力。针对这一难题,介绍了当前已经应用于垃圾邮件过滤领域主流的3种垃圾邮件过滤技术。通过详细分析各种技术的优缺点,对黑白名单过滤技术、基于规则的过滤技术和贝叶斯过滤技术进行整合,从而建立了一个分层次的垃圾邮件过滤系统模型,并对该过滤系统进行了性能分析。  相似文献   

16.
基于模糊自适应粒子群的垃圾邮件过滤新方法   总被引:1,自引:1,他引:0  
提出了一种新的垃圾邮件过滤方法(NSFM),从高维的文本特征中删除冗余的特征,选择对分类精度提高有贡献的特征,从而提高了垃圾邮件过滤的分类准确率。提出了一种模糊自适应粒子群(IFAPSO),通过模糊控制,动态的调控粒子群的惯性权重、学习因子和粒子数量比。NSFM包含核心特征选择、特征选择、垃圾邮件过滤3个阶段,第一阶段利用信息增益求取每个特征的信息值,构建核心特征集合,生成一定数量的核心特征子集;第二阶段根据核心特征子集对IFAPSO进行初始化,利用模糊控制器对粒子群进行自适应的调节,完成特征选择;第三阶段使用支持向量机对最优的特征子集分类,完成垃圾邮件过滤。本文采用PU1、Ling-Spam、SpamAssassin数据集数,通过多种对比实验证明:本方法自适应性强,可选择到较优的特征子集,有效地提高了分类精度,提升了垃圾邮件过滤的性能,具有较高的实用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号