共查询到20条相似文献,搜索用时 78 毫秒
1.
垃圾邮件的处理是电子邮件服务中非常重要的功能,该文在对标准邮件集表示为向量空间模型,降维处理处理工作的基础上,运用神经网络集成的方法来构造邮件分类器,对邮件进行过滤;该方法在垃圾邮件语料库上进行了实验,实验证明该方法对于垃圾邮件的过滤有较好的效果。 相似文献
2.
基于信件源的垃圾邮件过滤 总被引:8,自引:0,他引:8
众所周知,垃圾邮件问题已经是当今网络世界的一个严重问题。大量无用,甚至有害的信件在网络传播,不仅消耗了大量的网络资源,而且还严重威胁到邮件系统用户信息的安全,对邮件服务器本身提出了严峻的挑战。保护内部邮件服务器,在最大程度上减少垃圾邮件对邮件服务器的破坏是该文将讨论的主题。文章将对这一问题提出一种有效的解决方案,通过基于信件源的邮件过滤来自动地实现对邮件服务器的保护,并且对基于这种方案的反垃圾邮件技术的发展提出一些看法。 相似文献
3.
为了从大型数据库中获取有用的知识,采用了roughset理论。Roughset理论是一种研究不精确和不确定性知识的数学工具。利用粗糙集理论中属性核与不可分辨关系,提出了一种基于粗集的属性约简算法和消除冗余属性的数据过滤方法,并通过一个完整的实例验证了算法的有效性。 相似文献
4.
基于LVQ2神经网络及决策归纳的中文邮件过滤 总被引:4,自引:0,他引:4
垃圾邮件所带来的巨大经济损失及巨大的信息处理量已成为世界性的问题.目前,国际上应用效果较好的过滤技术是基于贝叶斯概率模型,但是由于汉语极为复杂的语义环境和贝叶斯算法的易欺骗性,使得其不能很好地过滤中文垃圾邮件.对此,该文提出了一种综合LVQ2神经网络及决策树分类的过滤算法.实验结果表明,该算法可以过滤98%以上的中文垃圾邮件. 相似文献
5.
陈柄汗 《电脑技术——Hello-IT》2003,(9):52-53
对于上网族而言,现在最痛苦的,恐怕就是每天总要面对成百上千封垃圾邮件。其实,如果仅仅是垃圾,那还不算太糟.顶多浪费点时间。假如遇到邮件病毒,那可就惨了。笔者的硬盘被血洗了两回,至今心有余悸。所以,一直想找一款真正有效而且方便易用的反垃圾邮件软件。最近,终于找到了,它就是MailMate! 相似文献
6.
一种基于神经网络的垃圾邮件过滤方法 总被引:2,自引:0,他引:2
垃圾邮件问题日益严重,受到研究人员的广泛关注,基于各种技术的垃圾邮件过滤方法应运而生,其中神经网络技术应用广泛.现在主要采用的后向传播(BP)神经网络虽然在垃圾邮件过滤中取得很好的效果,但仍然存在局部极小点、不能适应新样本、学习效率较低等诸多问题.因此,本文将一种有导师、可在线学习的自组织神经网络--预测自适应谐振理论神经网络(ARTMAP),运用于垃圾邮件过滤,提出了一种新的基于ARTMAP的垃圾邮件过滤方法.实验表明,基于ARTMAP的邮件过滤能够对垃圾邮件进行有效的过滤,在保证正确率的同时,更能适应当前垃圾邮件特征不断变化的环境. 相似文献
7.
王征 《计算机光盘软件与应用》2014,(10):302-303
作为现代社会中人们交流的一种重要方式,邮件对于提高用户之间的沟通效率具有重要作用。然而在电子邮件的大量应用过程中,垃圾邮件也逐渐崭露头角。对于用户来说,垃圾邮件不仅需要占用较多的时间精力去处理,其还会浪费大量的存储与宽带资源。所以,加强有关邮件系统垃圾邮件过滤技术的研究,对于改善邮件使用现状具有重要的现实意义。 相似文献
8.
李晓峰 《电脑编程技巧与维护》2011,(14):91-92
邮件过滤技术,为用户提供更安全方便的网络使用的主要技术.采用Boosting技术实现对垃圾邮件的分类,基本分类器选用RBF网络,最终假设通过投票方式实现.实验结果表明该方法有更好的过滤效果. 相似文献
9.
提出了一种新型的双层垃圾邮件过滤方法.该方法基于免疫学习,免疫记忆和免疫识别等机制,具有一定的自适应能力和多样性,充分利用了垃圾邮件与非垃圾邮件的特征,从而降低了非垃圾邮件被错判的风险.实验结果表明,双层过滤方法可有效的降低垃圾邮件的虚报率(非垃圾邮件被错判为垃圾邮件的比例). 相似文献
10.
随着因特网的不断普及,我国的电子邮件E-mail用户数呈指数级增长,E-mail服务是所有Internet服务中最基本的服务,超过百分之八十的用户使用E-mail服务。E-mail服务为人们的工作、生活、娱乐提供了极大的便利。然而任何事物都有正反两个方面,随着免费电子邮件的普及发展和易于获取,它也 相似文献
11.
基于有监督Bayesian网络的垃圾邮件过滤 总被引:6,自引:0,他引:6
对影响邮件特性的邮件报文格式作了仔细的分析并对垃圾邮件的特征进行了分类归纳,在此基础上构建了一个有监督的Bayesian邮件分类网络。通过对该网络作Bayesian参数估计,实现了判定邮件类别的不确定推理。对不同邮件测试集的在线学习试验结果表明,有监督Bayesian邮件分类网络能够有效地实现垃圾邮件的相对完备特征学习,改善邮件过滤的准确率。 相似文献
12.
13.
提出了一种基于K近邻(KNN)原理的快速文本分类算法。该算法不仅具有原始K近邻算法分类效果好的优点,还通过对训练样本进行压缩,消除相似度之间的比较,提高了分类效率。实验表明,该算法用于邮件过滤系统时,分类效果要优于基于朴素贝叶斯分类器的二项独立模型和多项式模型,而分类的时间复杂度与其相当,完全可以应用于实时邮件过滤。 相似文献
14.
Edelman等人根据其神经元群选择学说(the Theory of Neuronal Group Selection,TNGS)提出了脑感知学习的模型,将该模型中脑对陌生事物的学习类比于垃圾邮件过滤系统中对未知邮件的学习,提出了一种新的基于感知学习的网络垃圾邮件过滤算法,并将其应用于一种基于合作式网络的垃圾邮件过滤系统模型中。系统使用改进的文本数字签名技术得到邮件文本之间的内容相似度矩阵,将其与邮件到达的行为特征等一起作为该算法的参数,最后给出了仿真实验结果。 相似文献
15.
分析了目前在垃圾邮件过滤中广泛应用的NaveBayes过滤模型(NBF),指出了期望交叉熵(ECE)特征词选取方法的不足。提出了改进的NaveBayes垃圾邮件过滤模型(A-NBF),用改进的期望交叉熵(AECE)选取垃圾邮件特征词,并在邮件分类过程中对特征词进行加权,从而提高对垃圾邮件过滤的精度。实验结果可以看出A-NBF比NBF在过滤精度方面有明显的提高。 相似文献
16.
如何将邮件的头信息和内容信息有效结合起来进行垃圾邮件过滤备受研究人员的关注。基于粗糙集具有很好地处理不确定信息的特点,提出了一种基于粗糙集的两阶段邮件过滤方法,首先根据邮件头信息将其分为正常邮件、垃圾邮件和可疑邮件,再根据邮件内容将可疑邮件分为正常和垃圾邮件。通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法不仅能提高垃圾邮件过滤的准确率,而且能大幅降低误杀率。 相似文献
17.
18.
19.
针对堆叠自动编码机(SA)容易产生过拟合而降低垃圾邮件分类精度的问题,提出了一种基于动态dropout的改进堆叠自动编码机方法。首先分析了垃圾邮件分类问题的特殊性,将dropout算法引入到堆叠自动编码机算法中;同时,根据传统dropout算法容易使部分节点长期处于熄火状态的缺陷,提出了一种动态dropout改进算法,使用动态函数将传统静态熄火率修改为随着迭代次数逐渐减小的动态熄火率;最后,利用动态dropout算法改进堆叠自动编码机的预训练模型。仿真结果表明,相比支持向量机(SVM)和反向传播(BP)神经网络,改进的堆叠自动编码机平均准确率达到了97.66%,各个数据集上马修斯系数都大于89%;与传统堆叠自动编码机相比,改进的堆叠自动编码机的马修斯系数在Error1~6数据集上分别提高了3.27%、1.68%、2.16%、1.51%、1.58%、1.07%。实验结果表明,基于动态dropout算法的改进堆叠自动编码机具有更高的分类精度和更好的稳定性。 相似文献
20.
基于神经网络的电子邮件分类与过滤 总被引:2,自引:0,他引:2
现在电子邮件的应用非常广泛,已经成为人们生活中一种重要的通讯手段,但各种各样的垃圾邮件也是令我们十分困扰的问题,给出了一种电子邮件的分类过滤方法。电子邮件作为一种半结构化的文档,电子邮件信息包含了固定的语法部分和一定长度的可变文本部分,同时处理这两部分以得到更高的准确度。首先对邮件进行文本处理,得到特征向量;然后使用基于神经网络的方法对邮件进行分类过滤得到邮件分类器;最后通过实验验证分类器的有效性。 相似文献