首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
基于词条时序的朴素贝叶斯垃圾邮件过滤方法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法是一种有效的垃圾邮件过滤技术.互联网上的信息随着时间推移产生概念的变迁,最近出现的垃圾邮件词条可作为判定垃圾邮件的重要依据.将新近的垃圾邮件词条单独记录,在进行邮件分类时,对于最近出现的垃圾词条,提高其对垃圾邮件判定的先验概率.通过实验对比,提出的垃圾邮件过滤方法较传统的朴素贝叶斯垃圾邮件过滤具有更高的准确性、精确性和召回率.  相似文献   

2.
分析现有垃圾邮件过滤分类算法的不足,根据垃圾邮件的概念漂移特性,提出了一种基于CBR的垃圾邮件过滤算法.针对中文垃圾邮件特点提取特征,设计基于CRN网络的实例检索算法,该算法增加了预计算阶段,从而提高检索速度.实验结果表明,与传统贝叶斯算法相比,该算法对于动态变化的中文垃圾邮件数据集有更好的过滤效果.  相似文献   

3.
垃圾邮件过滤技术   总被引:1,自引:1,他引:0  
电子邮件已经成为人们日常生活中通信、交流的重要手段之一,但垃圾邮件问题也日益严峻,网民平均每天收到的垃圾邮件数量已超过了正常邮件.因此目前反垃圾邮件技术的研究成为了一个热门的话题.文中介绍了基于安全认证、规则匹配和统计学习三类邮件过滤技术及应用情况,分析了过滤技术面临的挑战并指出垃圾邮件过滤的发展趋势.  相似文献   

4.
本文基于生物免疫系统防御机制,探讨了将人工免疫原理应用于垃圾邮件过滤系统(IDSFS),通过动态生成垃圾邮件疫苗,提高系统的检出率.另外,针对传统邮件过滤系统存在的错误肯定率、错误否定率等不足及用户对邮件个性化处理的要求,引入用户反馈机制,使得系统精确率、正确率进一步提高.实验结果表明,该系统具有较强的自学习、自适应能力.  相似文献   

5.
基于贝叶斯神经网络的垃圾邮件过滤方法   总被引:10,自引:2,他引:10  
垃圾邮件过滤是当前互联网应用中急需解决的一个重要课题,日益受到人们的关注。本文提出了一种基于贝叶斯神经网络BNN(Bayesian Neural Network)的垃圾邮件过滤方法,利用贝叶斯推理和神经网络相结合的贝叶斯神经网络算法对用户给定的正常/垃圾邮件集合进行训练,得到邮件过滤模型。并且提出了一种有效的特征选择方法,采用信息增益准则,有效降低了特征维数。经过实验测试,本文提出的方法可以实现对垃圾邮件的有效过滤。  相似文献   

6.
基于主动学习和否定选择的垃圾邮件分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
胡小娟  刘磊  邱宁佳 《电子学报》2018,46(1):203-209
针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集作为检测器,新增样本集作为自体集,对两者进行异常匹配.本文算法与在线垃圾邮件快速识别方法、增强差异性的半监督协同分类算法、垃圾邮件过滤方法、基于人工高免疫的多层垃圾邮件过滤算法和在线主动多领域学习方法在六个常用邮件语料集上进行了分析比较,结果表明本文算法具有较高的准确率、召回率、分类精度,和较低的用户标注负担.使用用户个性喜好转换为双向兴趣特征的方式有助于提高算法的分类能力;利用异常检测匹配选取未知类别特征的方式,有效地降低了用户标注负担.  相似文献   

7.
针对目前互联网垃圾邮件日益泛滥的情况,对目前常用的几种抗击垃圾邮件方法进行了介绍,同时提出一种混合型的垃圾邮件过滤系统,对其进行了详细地阐述。该方法结合贝叶斯理论和基于内容的邮件过滤思想,给出了邮件过滤系统的体系结构,并对其算法进行了分析。  相似文献   

8.
王彤彤  韩文报  窦勇 《通信技术》2007,40(12):299-301
随着互联网的发展,电子邮件成为了一类重要应用。然而垃圾邮件的产生极大的制约了电子邮件的应用。文中提出了一类基于矢量空间模型的垃圾邮件去重复技术(VMF),从删除重复邮件的角度,给出了一种垃圾邮件过滤的方法。与现存技术相比,VMF在召回率和适应性等方面均有显著提高。  相似文献   

9.
垃圾邮件具有特征维数高、样本不平衡等特点,针对近邻算法(KNN)或支持向量机(SVM)存在虚警率高等难题,基于组合优化理论,提出基于KNN-SVM的垃圾邮件过滤组合模型。首先提取垃圾邮件的特征项,并构建垃圾邮件过滤模型的输入向量,然后采用KNN对垃圾邮件训练样本进行选择,将训练样本缩减到k个,并采用支持向量机对k个样本训练和建模进行垃圾邮件过滤,最后采用中文邮件集对KNN-SVM的性能进行分析。结果表明,KNN-SVM提高了垃圾邮件过滤的准确率,大幅度降低了虚警率,而且垃圾邮件的过滤速度可以满足邮件处理的在线需求。  相似文献   

10.
一种基于N-gram组合的中文垃圾邮件过滤方法   总被引:3,自引:0,他引:3  
中文垃圾邮件的泛滥提出了极为迫切的技术诉求。本文使用了基于简单贝叶斯模型的过滤算法,同时使用N-gram对中文文本进行自动分词,并且组合多个N-gram来加快分类的收敛速度,这样分类是一种切实可行的垃圾邮件过滤方法。对于这种代价敏感性(cost sensitive)的分类,通过移动门限值的方法来处理:在评估结果时采用了TCR以及召回率(SR)和正确率(SP)等参数考察实验数据。实验表明:这种方法代价较小,而正确率较高。最后我们认为可以通过筛选训练邮件以及和其它措施相结合来满足ISP级别等应用场合的要求。  相似文献   

11.
图像垃圾邮件的发展和防范   总被引:2,自引:0,他引:2  
垃圾邮件一直困扰着人们,图像垃圾邮件是垃圾邮件的变种,其危害远远大于传统的文本类垃圾邮件.本文首先给出了图像垃圾邮件的定义,介绍了图像垃圾邮件的类型和特点,然后分析了图像垃圾邮件的演进过程,总结了图像垃圾邮件的构造方法,最后探讨了图像垃圾邮件的防范措施.  相似文献   

12.
由于电子邮件在互联网上的广泛应用,出现了垃圾邮件的泛滥和占用网络带宽,垃圾邮件给用户正常收发邮件造成了严重困扰。提出了一种新的基于兴趣相似度的协作式邮件过滤方案,使得兴趣相似的用户迅速聚合成信息共享的团体,每个用户在团体内选择出最合适的过滤规则集进行有效的共享。实验表明,该方案在保持一定的过滤精度的同时有效降低了误判率。  相似文献   

13.
寇晓淮  程华 《电信科学》2017,33(11):73-82
垃圾邮件过滤技术在保证信息安全、提高资源利用、分拣信息数据等方面都发挥着重要作用。然而,垃圾邮件的出现影响了用户的体验,并且会造成不必要的经济与时间损失。针对现有的垃圾邮件过滤技术的不足,基于多个主题词理论,构建了基于朴素贝叶斯的垃圾邮件分类方法。在邮件主题获取中,采用主题模型LDA得到邮件的相关主题及主题词;并进一步采用Word2Vec寻找主题词的同义词和关联词,扩展主题词集合。在邮件分类中,对训练数据集进行统计学习得到词语的先验概率;基于扩展的主题词集合及其概率,通过贝叶斯公式推导得到某个主题和某封邮件的联合概率,以此作为垃圾邮件判定的依据。同时,基于主题模型的垃圾邮件过滤系统具有简洁易应用的特点。通过与其他典型垃圾邮件过滤方法的对比实验,证明基于主题模型的垃圾邮件分类方法及基于Word2Vec的改进方法均能有效提高垃圾邮件过滤的准确度。  相似文献   

14.
一种基于人工免疫的垃圾邮件过滤算法   总被引:2,自引:2,他引:0  
随着电子邮件日益广泛的使用,如何有效地解决严重的垃圾邮件问题已成为一个亟待解决的问题。受生物免疫系统自我保护机制的启发,提出了一种基于人工免疫的垃圾邮件过滤算法。在掌握现有信息处理技术方法的前提下,针对现有信息处理技术存在的问题,设计并通过仿真分析了系统的动态性与自适应性性能,并从理论和实验两个方面验证了这种方案的可行性与有效性。  相似文献   

15.
垃圾邮件日益泛滥,严重损害了互联网服务提供商和消费者的利益。介绍了现有的反垃圾邮件的技术发展与现状,在分析电子邮票系统设计的基础上,提出了一种基于分布式的信誉度管理进行垃圾邮件防护的方法。同时,针对信誉度方法,给出了新的系统信誉层次结构的具体框架和实现垃圾邮件防护的过程。理论和实验结果表明:该方法可以有效地提高邮件的误判率,从而弥补了基于发送许可的邮件验证系统所产生的缺陷。  相似文献   

16.
为了减少将合法邮件误判为垃圾邮件的误报率及将垃圾邮件误判为合法邮件的漏报率的损失,首先基于现有的文本特征提取评估函数:期望交叉熵及互信息提出一种新的评估函数。利用此函数可提取到更具有代表性的邮件特征向量。在此之上提出一种基于贝叶斯公式可减少损失的垃圾邮件过滤方法。经过仿真测试后,发现基于新评估函数的新方法可有效降低误报率和漏报率。  相似文献   

17.
垃圾短信监控的原理与实现   总被引:5,自引:0,他引:5  
垃圾短信监控是针对手机短信的安全而提出的一个新课题.短信业务系统的安全隐患存在于接入部分、短信中心和短信网关,现网中应用较多的监控机制有3种:实时过滤机制、话单分析机制和协议监测机制.它们的侧重点各不相同,可以组合使用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号