首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
以朴素贝叶斯理论作为基石并结合信息增益、代价因子等方法,尝试设计一种基于用户需求的垃圾邮件过滤分类模型,在垃圾邮件一次分类基础上提出邮件先过滤后分类方法,进而改进传统邮件分类一次阈值比较,变为两次阈值比较,且应用反馈技术以应对垃圾邮件的日益变化.该模型可能会对垃圾邮件多分类研究具有一定的参考价值.  相似文献   

2.
在分析传统垃圾邮件过滤技术的基础上,提出了一种基于神经网络和用户反馈的反垃圾邮件技术.通过引入用户反馈机制,使用神经网络分类方法,构建面向特定用户的过滤器,从而进行垃圾邮件过滤.实验证明,该方法能够有效地降低误报率,提高反垃圾邮件系统的可用性,具有较好的实用效果.  相似文献   

3.
本文基于生物免疫系统防御机制,探讨了将人工免疫原理应用于垃圾邮件过滤系统(IDSFS),通过动态生成垃圾邮件疫苗,提高系统的检出率.另外,针对传统邮件过滤系统存在的错误肯定率、错误否定率等不足及用户对邮件个性化处理的要求,引入用户反馈机制,使得系统精确率、正确率进一步提高.实验结果表明,该系统具有较强的自学习、自适应能力.  相似文献   

4.
陆青梅  尹四清 《信息技术》2008,32(2):118-120
邮件过滤技术是反垃圾邮件的重要手段,目前对垃圾邮件的过滤主要有基于内容、基于IP地址和基于信头、信封等方法,这些方法对垃圾邮件的过滤起到了一定作用.但是由于信体是垃圾邮件的最终载体,而仅依据IP地址、信头、信封中的特征容易造成错误判断.在贝叶斯分类器的工作原理的基础上,提出了基于贝叶斯分类器的反垃圾邮件模型的原理与实现方法,将反映垃圾邮件的特征综合在一起统称为"属性",避免了单纯基于IP、信头、信封过滤的规则性太强的缺点,降低将正常邮件判断为垃圾邮件的风险.  相似文献   

5.
寇晓淮  程华 《电信科学》2017,33(11):73-82
垃圾邮件过滤技术在保证信息安全、提高资源利用、分拣信息数据等方面都发挥着重要作用。然而,垃圾邮件的出现影响了用户的体验,并且会造成不必要的经济与时间损失。针对现有的垃圾邮件过滤技术的不足,基于多个主题词理论,构建了基于朴素贝叶斯的垃圾邮件分类方法。在邮件主题获取中,采用主题模型LDA得到邮件的相关主题及主题词;并进一步采用Word2Vec寻找主题词的同义词和关联词,扩展主题词集合。在邮件分类中,对训练数据集进行统计学习得到词语的先验概率;基于扩展的主题词集合及其概率,通过贝叶斯公式推导得到某个主题和某封邮件的联合概率,以此作为垃圾邮件判定的依据。同时,基于主题模型的垃圾邮件过滤系统具有简洁易应用的特点。通过与其他典型垃圾邮件过滤方法的对比实验,证明基于主题模型的垃圾邮件分类方法及基于Word2Vec的改进方法均能有效提高垃圾邮件过滤的准确度。  相似文献   

6.
针对现有朴素贝叶斯贝努利模型在垃圾邮件过滤时存在的不能体现待分类邮件中文本特征词重要性而导致合法邮件误判为垃圾邮件等问题,引入特征词加权的思想,提出一种低损失的贝叶斯垃圾邮件过滤算法。实验结果表明:该算法能降低合法邮件被误判而带给用户的损失,提高过滤的正确性。  相似文献   

7.
论文提出了一种基于邻近类别分类的邮件过滤系统模型,并介绍了系统涉及到的文本特征选择、贝叶斯分类算法等关键技术,最后给出了评价方法与实验结果。结果表明,该方法能够显著地提高系统对于垃圾邮件的查准率。  相似文献   

8.
针对海量文本邮件的挖掘过滤需要更大的存储空间、以及更强的计算能力,提出一种基于Hadoop云计算平台的垃圾邮件过滤方法.其思想:把相对孤立的数据集合并成易于云平台处理的大文件集合;依据评估函数构建文本向量,将邮件转换为结构化的描述;基于MapReduce分布式编程模型改进SVM算法,利用集群整体的计算能力求解最优平面.实验表明:该方法能利用廉价的计算机集群代替昂贵的高性能机器实现海量邮件数据的挖掘过滤;并且,分类效率能随着集群规模的扩增而提升较快.  相似文献   

9.
提出一种基于多特征模糊关联的垃圾邮件过滤方法.该方法分为预处理和实时处理两个阶段,在预处理阶段,分析训练样本集,提取邮件的发送源特征和文本特征的典型特征值集合,计算典型特征值与合法邮件类、垃圾邮件类之间的模糊关联度.在实时处理阶段,根据待分类邮件所包含的特征值,计算邮件的类支持度,然后利用Dempster-Shafer 证据理论实现多个特征的分类融合与判决.实验结果表明,此方法能有效提高垃圾邮件过滤的查全率和查准率.  相似文献   

10.
伴随着电子邮件的广泛使用,垃圾邮件泛滥成灾,严重影响了人们正常的学习、工作和生活。本文通过对垃圾邮件的分析与处理,设计并实现了基于贝叶斯方法的客户端邮件过滤系统。实验证明贝叶斯方法能够有效的过滤垃圾邮件。  相似文献   

11.
本简要地分析和概括了垃圾邮件的种类和内容:从技术的角度上介绍了垃圾邮件的制造是如何获得邮件用户的邮件地址,发送垃圾邮件;还介绍了反垃圾邮件系统之一——邮件网关的种类以及及其处理垃圾邮件的方法。  相似文献   

12.
基于词条时序的朴素贝叶斯垃圾邮件过滤方法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法是一种有效的垃圾邮件过滤技术.互联网上的信息随着时间推移产生概念的变迁,最近出现的垃圾邮件词条可作为判定垃圾邮件的重要依据.将新近的垃圾邮件词条单独记录,在进行邮件分类时,对于最近出现的垃圾词条,提高其对垃圾邮件判定的先验概率.通过实验对比,提出的垃圾邮件过滤方法较传统的朴素贝叶斯垃圾邮件过滤具有更高的准确性、精确性和召回率.  相似文献   

13.
基于支持向量机的电子邮件过滤技术   总被引:1,自引:0,他引:1  
有别于传统的电子邮件过滤技术,文章在垃圾邮件识别过程中引入主要针对邮件信头非文本信息的信件分类机制,进而基于支持向量机完成电子邮件信头信息过滤模型的搭建工作。实验结果表明,对应模型能够提高邮件过滤系统对于垃圾邮件的识别率,同时降低了系统对正常邮件的误判率。  相似文献   

14.
目前对于大量垃圾邮件问题尚没有十分有效的解决办法。垃圾邮件的传播者总会以不同的方式绕过邮件过滤器而到达用户的邮箱。研究本题目就是为了建立一套类似于网络防火墙的设备,以高效、准确地过滤垃圾邮件,净化网络环境。  相似文献   

15.
邮件过滤器系统的设计与实现   总被引:5,自引:0,他引:5  
在对垃圾邮件及其防范技术进行全面分析与比较的基础上,针对传统特征过滤技术的被动防范和能力不足问题,提出了利用多邮件地址分类使用的主动防范技术,并通过一个使用户可以自主地扩展自己邮件地址的原型系统,与传统的特征过滤技术配合,形成了更为有效的垃圾邮件防范能力。  相似文献   

16.
电子邮件分类有利于垃圾邮件的过滤,节省网络资源。为了提高邮件分类的精度,提出了改进支持向量机的电子邮件分类器模型。首先提取电子邮件的原始特征,并采用主成分分析法对特征进行选择,减少特征数量,提高邮件分类效率;然后采用支持向量机建立电子邮件分类器,并对传统支持向量机参数选择方法进行改进,改善邮件分类效果,最后采用邮件分类的标准数据库——UCI进行性能分析。结果表明,改进支持向量机解决了当前电子邮件分类模型的不足,获得了理想的电子邮件分类效果,分类结果可以帮助管理人员拦截垃圾邮件。  相似文献   

17.
基于主动学习和否定选择的垃圾邮件分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
胡小娟  刘磊  邱宁佳 《电子学报》2018,46(1):203-209
针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集作为检测器,新增样本集作为自体集,对两者进行异常匹配.本文算法与在线垃圾邮件快速识别方法、增强差异性的半监督协同分类算法、垃圾邮件过滤方法、基于人工高免疫的多层垃圾邮件过滤算法和在线主动多领域学习方法在六个常用邮件语料集上进行了分析比较,结果表明本文算法具有较高的准确率、召回率、分类精度,和较低的用户标注负担.使用用户个性喜好转换为双向兴趣特征的方式有助于提高算法的分类能力;利用异常检测匹配选取未知类别特征的方式,有效地降低了用户标注负担.  相似文献   

18.
垃圾邮件的误判问题一直是反垃圾邮件领域中未能得到根本解决的难点。基于清华大学邮箱系统及反垃圾邮件网关系统进行了一整年的部署和实验(2011年9月至2012年10月),通过用户对可疑垃圾邮件点击召回的历史行为进行分析,并采用对其感兴趣的垃圾邮件进行文本相似度计算以及关键参数预测的方法来智能化预测用户对当前某一封垃圾邮件的感兴趣程度,即基于用户主观的选择和体验来帮助用户自动召回其可能感兴趣、然而却被反垃圾邮件网关误判的垃圾邮件,解决了传统过滤方法无法杜绝误判的问题。  相似文献   

19.
为降低对合法邮件的误判,提出一种基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法。该方法将邮件划分为“合法邮件”、“可疑邮件”和“垃圾邮件”3类,在第一阶段,利用朴素贝叶斯算法速度快、分类性能好的优点,对邮件进行初步分类;在第二阶段,基于垃圾邮件的发送特征,利用层次聚类算法进行相似性比较。实验表明,该方法能够显著提高垃圾邮件的查准率,降低对合法邮件的误判,更加符合实际应用需求。  相似文献   

20.
张尼  姜誉  方滨兴  郭莉 《通信学报》2007,28(12):90-95
提出一种基于邮件路径地理属性分析的邮件过滤算法GEPA(geographic E—mail path analysis)。首先提取邮件命令报文包含的路由信息,并以此为基础构建邮件路径子集;其次采用一种高效的地理属性映射方法进行地理信息映射;接着对路径中节点的地理逻辑关系背离情况进行分析用于过滤垃圾邮件;最后从中国大陆某骨干网边界路由器的一条链路上(该链路跨越地理边界)采集邮件流量以验证算法性能。研究表明,GEPA识别的垃圾邮件约占邮件总量的13.9%,且算法在执行速度和内存开销等方面具有较好的性能,能够满足实时邮件过滤的需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号