首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 359 毫秒
1.
基于内容与行为特征的反垃圾邮件系统   总被引:1,自引:0,他引:1  
邮件过滤技术是反垃圾邮件的重要手段,但是单纯从内容过滤或者行为识别出发,不能有效的杜绝垃圾邮件的泛滥。本文提出了一种基于服务器端的垃圾邮件过滤系统,它通过对垃圾邮件内容和行为两方面进行特征提取,将反映垃圾邮件的特征综合在一起统称为“属性”进行多重侦测。内容过滤方面采用可学习的Bayes算法,行为识别方面则提取垃圾邮件在发送过程中的特征进行有效的阻断。添加客户端自定义处理模块,从而避免了单纯基于IP、信头、信封过滤的规则性太强的缺点,降低将正常邮件判断为垃圾邮件的风险。  相似文献   

2.
为了解决基于服务端的垃圾邮件过滤系统难以满足某一群体邮件过滤的特殊要求,分析了Email邮件协议和邮件格式特征,设计与实现了一种客户端垃圾邮件过滤系统.系统采用黑白名单过滤、邮件特征过滤和贝叶斯分类相结合的三层过滤技术,并通过用户反馈机制降低误报率.实验结果显示,系统可满足用户对邮件过滤的个性需求,提高了垃圾邮件过滤的准确性.  相似文献   

3.
垃圾邮件给广大邮件用户带来了极大的不便。本文总结了各种反垃圾邮件技术,分析了每项技术的优点和缺点。重点介绍了一种叫做信息接种的协作过滤算法,它使邮件用户实现协作,提高垃圾邮件过滤器的准确率。  相似文献   

4.
垃圾邮件是互联网的一大难题,大量的垃圾邮件让我们不胜其烦,甚至影响到我们的工作生活。如何更好地清除垃圾邮件呢?这让邮件客户端和邮件服务提供商们费尽了心机。各种垃圾邮件过滤层出不穷,比较著名的就有贝叶斯垃圾邮件过滤算法。不过,这些垃圾邮件的过滤方法都是在垃圾邮件接收下来后才进行过滤的,  相似文献   

5.
结合邮件的半结构化特征,将最大熵模型引入垃圾邮件过滤中,构造出基于最大熵模型的垃圾邮件过滤系统框架.在此基础上,将其与Outlook提供的PIA相结合,利用.NET技术开发出基于最大熵模型的垃圾邮件过滤插件,在客户端实现了基于内容的垃圾邮件过滤,较好地解决了垃圾邮件的问题.  相似文献   

6.
基于Qmail的邮件过滤系统的设计与实现   总被引:6,自引:0,他引:6  
对垃圾邮件的过滤能力是邮件服务器性能的重要标识之一,在MTA层次可以实现真正意义上的邮件过滤,并且可以有效防止邮件病毒。本文介绍了邮件过滤的基本原理,基于Qmail邮件服务器,用perl语言实现了一个邮件过滤系统应用实例。  相似文献   

7.
邮件过滤技术是反垃圾邮件的重要手段,本文提出了一种基于服务器端的垃圾邮件过滤系统,它采用改进的Bayes算法,将反映垃圾邮件的特征综合在一起统称为"属性",用这些"属性"构成表示邮件特征的向量空间模型重点特征向量,避免了单纯基于IP、信头、信封过滤的规则性太强的缺点,降低将正常邮件判断为垃圾邮件的风险。  相似文献   

8.
基于数据挖掘方法的电子邮件过滤   总被引:8,自引:0,他引:8  
电子邮件在给人们带来很多方便抽时,也产生了一个新的问题,即大量垃圾邮件的出现。邮件过滤就是从大量邮件中过滤出垃圾邮件,帮助用户寻找到所需要的有用邮件。本文介绍了一个基于数据挖掘方法的邮件过滤系统原型,给出了Bayes方法的几个基于概念,并重点讨论了要实现这个系统所需要处理的几个关键问题。  相似文献   

9.
基于神经网络的"垃圾"邮件过滤系统设计   总被引:2,自引:0,他引:2  
为了对垃圾邮件进行有效地过滤,以神经网络作为分类器,采用由垃圾邮件发送者进行确认的邮件认证方法设计了邮件过滤系统。神经网络的自学习、自适应能力解决了垃圾邮件特征不断变化而过滤方法相对固定的矛盾。新的垃圾邮件认证方法使发送垃圾邮件比接收垃圾邮件更费时间,减少了用户收到垃圾邮件的数量。  相似文献   

10.
前置式邮件过滤系统的设计与实现   总被引:2,自引:0,他引:2  
针对互联网垃圾邮件泛滥的现状,该文设计了一种新的前置式邮件过滤系统。该系统独立于原邮件服务器,动态统计各SMTP客户端的发信频率,同时使用基于有限自动机的DFSA算法,快速过滤各种常见汉字编码的电子邮件。对于拦截信件,系统开放必要的邮件转发恢复操作,从而把误拦正常信件的可能性降至最低。该文最后给出系统实现并且进行性能验证。  相似文献   

11.
对垃圾邮件的定义、主要危害、滥发原因以及对垃圾邮件过滤技术的主要方法进行了研究,分析了过滤技术在反垃圾邮件中的作用.  相似文献   

12.
对垃圾邮件的定义、主要危害、滥发原因以及对垃圾邮件过滤技术的主要方法进行了研究,分析了过滤技术在反垃圾邮件中的作用。  相似文献   

13.
垃圾邮件的处理是电子邮件服务中非常重要的功能,该文在对标准邮件集表示为向量空间模型,降维处理处理工作的基础上,运用神经网络集成的方法来构造邮件分类器,对邮件进行过滤;该方法在垃圾邮件语料库上进行了实验,实验证明该方法对于垃圾邮件的过滤有较好的效果。  相似文献   

14.
An Operable Email Based Intelligent Personal Assistant   总被引:1,自引:0,他引:1  
The recent phenomena of email-function-overloading and email-centricness in daily life and business have created new problems to users. There is a practical need for developing a software assistant to facilitate the management of personal and organizational emails, and to enable users to complete their email-centric jobs or tasks smoothly. This paper presents the status, goals, and key technical elements of an Email-Centric Intelligent Personal Assistant, called ECIPA. ECIPA provides various assisting functions, including automated and cost-sensitive spam filtering based on corresponding analysis, ontology-mediated email classification, query and archiving. ECIPA can learn from dynamic user behaviors to effectively sort and automatically respond email. Techniques developed in Web Intelligence (WI) are adopted to implement ECIPA. In order to facilitate cooperation of ECIPAs of different users, the concept of operable email, an extension of traditional email with an operable form, is introduced. ECIPA can in fact be viewed as a family of collaborative agents working together on the operable email.  相似文献   

15.
结构化集成学习垃圾邮件过滤   总被引:4,自引:0,他引:4  
为了解决垃圾邮件过滤算法低计算复杂度与高分类准确率之间的矛盾,在多域学习框架下提出一种结构化集成学习思想,它根据文档结构组合多个基分类器的结果以追求更高分类性能.采用邮件文档的字符串特征生成多个轻量基分类器,并采用字符串-频率索引存储标注数据,使得每次更新和查询的时间开销是常数量级.根据邮件文档的多域结构特性,提出历史域分类器效力线性组合权和当前域文档分类能力线性组合权.综合考虑历史域分类器效力和当前域文档分类能力,还提出一种能够提高整体分类准确率的综合线性组合权.在TREC立即全反馈垃圾邮件过滤任务上的实验结果表明:基于综合线性组合权的结构化集成学习方法能够在较短的时间(47.24min)内完成过滤任务,整体性能1-ROCA达到参加TREC2007评测的最优过滤器性能(0.005 5).  相似文献   

16.
本文提出了一种个性化垃圾邮件过滤方法,它能够根据用户反馈自动学习出用户兴趣,并随时间的推移自动适应用户兴趣的变化。该方法首先抽取邮件的语言特征和行为特征构建多个基于规则的单独过滤器,然后采用SVM集成学习方法组合这些单独过滤器的结果。为了提高学习速度、减少用户提供反馈的数量,本文采用了主动学习方法挑选更加富含知识的邮件请求用户给出反馈。实验结果表明:集成学习和主动学习相结合的个性化过滤方法在个性化程度、分类准确率、过滤速度以及自动学习能力等方面具有更好的性能。  相似文献   

17.
As the importance of email increases, the amount of malicious email is also increasing, so the need for malicious email filtering is growing. Since it is more economical to combine commodity hardware consisting of a medium server or PC with a virtual environment to use as a single server resource and filter malicious email using machine learning techniques, we used a Hadoop MapReduce framework and Naïve Bayes among machine learning methods for malicious email filtering. Naïve Bayes was selected because it is one of the top machine learning methods(Support Vector Machine (SVM), Naïve Bayes, K-Nearest Neighbor(KNN), and Decision Tree) in terms of execution time and accuracy. Malicious email was filtered with MapReduce programming using the Naïve Bayes technique, which is a supervised machine learning method, in a Hadoop framework with optimized performance and also with the Python program technique with the Naïve Bayes technique applied in a bare metal server environment with the Hadoop environment not applied. According to the results of a comparison of the accuracy and predictive error rates of the two methods, the Hadoop MapReduce Naïve Bayes method improved the accuracy of spam and ham email identification 1.11 times and the prediction error rate 14.13 times compared to the non-Hadoop Python Naïve Bayes method.  相似文献   

18.
随着个人用户的数据和信息级数增长,个人信息管理的研究成为热点.电子邮件作为个人信息的重要载体在个人信息业务中占据着重要的地位.随着个人信息的增加,用户在对邮件进行查询时经常遇到遗忘关键字的困扰,对此普通的邮件工具很难为用户组织和管理个人信息提供帮助.提出了一个基于实体发现、查找和管理的中文邮件管理系统--ECMail,有效改善了以上问题,同时对关键技术-中文分词、实体挖掘和实体关联管理的实现提出了自己的想法和处理机制,最终达到了提高用户邮件管理效率的目的.  相似文献   

19.
邮件过滤算法的比较   总被引:1,自引:0,他引:1  
探讨了邮件过滤器的体系,介绍了6种常用的过滤算法.在4个公用的数据集上,利用3个评价指标对这6种算法进行了全面的比较.实验的主要结论有:集成过滤器的方法有利于提高过滤效果;与其它两个数据集相比,PU1和Ling-spam数据集用于评价过滤器时会得出相对乐观的结果;NB和k-NN的表现不稳定,对数据集的敏感程度较高.对于邮件过滤研究者了解、改进已有算法,提出新的算法有一定的参考价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号