共查询到19条相似文献,搜索用时 78 毫秒
1.
垃圾邮件的泛滥提出了极为迫切的技术诉求。文章介绍了基于文本分类技术的垃圾邮件过滤系统模型,并首先介绍了整个系统工作流程,然后阐述了系统中文本分词、文本特征提取、Winnow线性分类器等关键环节。 相似文献
2.
在深入分析了传统垃圾邮件过滤技术不足的基础上,提出并实现了一种新型的基于URL过滤的垃圾邮件过滤技术(URLbased spamfiltering,UBSF)。该方法通过对比从到来邮件中提取的URL与URL库中存储的URL信息的相似性来判定垃圾邮件。通过语料库以及构建实际系统原型的测试,表明该方法具有准确性高、误报率低以及实时处理速度快的优点。 相似文献
3.
曾小宁 《计算机应用与软件》2009,26(7):98-101
通过对垃圾邮件的现状、特征、以及现有的垃圾邮件过滤技术的分析研究,提出一种基于过滤规则和IP信誉的垃圾邮件过滤技术.方法改进了传统的黑白名单技术,加入了评分机制,对IP进行评分,把IP信誉细分为四个等级,分别为优、良、中、差,并结合基于过滤规则的垃圾邮件过滤技术,互补不足,以达到更好的垃圾邮件过滤效果.同时,设计加入了用户反馈,以弥补因误判而造成的损失.实验表明,设计适于用户终端使用,有较高的可行性. 相似文献
4.
奚建荣 《计算机应用与软件》2011,28(6)
为了解决基于服务端的垃圾邮件过滤系统难以满足某一群体邮件过滤的特殊要求,分析了Email邮件协议和邮件格式特征,设计与实现了一种客户端垃圾邮件过滤系统.系统采用黑白名单过滤、邮件特征过滤和贝叶斯分类相结合的三层过滤技术,并通过用户反馈机制降低误报率.实验结果显示,系统可满足用户对邮件过滤的个性需求,提高了垃圾邮件过滤的准确性. 相似文献
5.
尽管网络流量会出现异常,但大部分时间里流量变化是有规律的。如果网络流量出现异常,那么对整个网络具有较大的危害性,因此网管人员必须及时发现流量是否异常。在以往的流量检测算法中聚焦的焦点只是如何区分流量是正常还是异常,并未讨论此时是否存在攻击行为,这些是算法的不足之处。为了改进现有算法的不足之处,作者在查阅了有关资料和文献之后,提出了一种新的流量检测算法,该算法使用了相似性计算法算法,MMTD算法和粗糙集中的决策系统,将这三种算法在流量检测中进行应用是本文的创新点。本文解决问题的思路是首先使用MMTD算法对当前的流量是否异常做出判断,如果出现异常,则使用相似性计算算法将此时的流量与预警值进行比较,并且判断此时是否存在攻击行为,在文章的最后使用粗糙集中的决策系统对流量异常的原因做出决策。 相似文献
6.
7.
一种基于邮件头信息的三支决策邮件过滤方法 总被引:1,自引:0,他引:1
提出一种基于邮件头信息的三支决策垃圾邮件过滤方法。该方法使用一种新的属性重要度度量方法,并用该度量方法将邮件头信息属性依据重要度大小进行排序,然后按属性重要度的大小顺序对邮件计算贝叶斯概率并进行三支决策。当信息较少以致不足以决策时,按属性重要度大小顺序增加新的属性信息以帮助进一步的决策,直到得到最后的邮件分类。对比实验结果表明,该方法是合理且有效的。 相似文献
8.
分类问题是机器学习与数据挖掘研究中最重要的问题之一,其中文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.设计了一种基于贝叶斯概率推理方法的垃圾邮件过滤系统.它用概率测试的权重来描述数据间的相关性,从而解决了数据间的不一致性,甚至是相互独立的问题.作为互联网的第一大应用,电子邮件一直受到广大网民的青睐,但近些年来,垃圾邮件问胚日益严重.将上述研究的结果应用到目前互联网上垃圾邮件的过滤工作中,实验证明了方法的有效性. 相似文献
9.
分类问题是机器学习与数据挖掘研究中最重要的问题之一,其中文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。设计了一种基于贝叶斯概率推理方法的垃圾邮件过滤系统。它用概率测试的权重来描述数据间的相关性,从而解决了数据间的不一致性,甚至是相互独立的问题。作为互联网的第一大应用,电子邮件一直受到广大网民的青睐,但近些年来,垃圾邮件问题日益严重。将上述研究的结果应用到目前互联网上垃圾邮件的过滤工作中,实验证明了方法的有效性。 相似文献
10.
11.
本文在对中文邮件关键词提取方法、关键词的降维处理与优化提炼以及垃圾邮件识别概率等方面进行理论探讨的同时,较为详细地阐述了中文环境下贝叶斯过滤技术的使用方法,这对有效减少垃圾邮件数量,提高网络利用率具有重要的理论价值和现实意义。 相似文献
12.
13.
14.
近年来,电子邮件方便人们的生活,同时,也有大量的垃圾邮件不断涌现,随之也出现了各种垃圾邮件过滤技术。文中主要介绍基于信件源垃圾邮件过滤技术和基于内容的垃圾邮件过滤技术,通过对这两种技术的介绍,分析了垃圾邮件过滤技术的优缺点,并对垃圾邮件过滤技术中存在的问题进行了讨论。垃圾邮件发送者不断改变发送策略以逃避过滤技术的过滤,垃圾邮件发送策略也不断的更新。文中对近年来垃圾邮件发送的新策略进行了详细的阐述,讨论目前垃圾邮件过滤技术研究中遇到的问题和挑战。 相似文献
15.
以智能决策支持系统结构为基础,提出了一种新的电子邮件过滤模型,并对中文垃圾邮件过滤中的中文分词及垃圾邮件特征知识库的更新等关键问题进行了探讨。开发了“智能邮件过滤系统(IEFS)”,使垃圾邮件误判率得到了一定程度的控制,有效防止了垃圾邮件的泛滥。 相似文献
16.
17.
垃圾邮件制造者采用图像来隐藏垃圾信息,把文字隐藏在图像中并带一定的倾斜。在对含有倾斜文字的图像邮件深入分析后,针对图片中含有倾斜文字的垃圾邮件,文章给出了一种在进行OCR识别之前对图像进行hough变换,并结合支持向量机识别垃圾邮件的算法,实验结果表明,该方法具有比较满意的过滤效果。 相似文献
18.
分类问题,尤其是文本自动分类一直是机器学习与数据挖掘研究中的研究热点与核心技术,其中如朴素贝叶斯、KNN等近年来得到了广泛的关注和快速的发展。文中在统计学理论的基础上给出了一种基于支持向量机方法的文本分类算法,并设计出了相应的垃圾邮件过滤系统。实验证明与朴素贝叶斯方法相比,该算法极大地提高了分类准确率和查全率,具有应用推广的价值。 相似文献
19.
随着互联网的快速发展,垃圾邮件的横行不仅浪费邮件接收人员的时间,也给网络资源的管理和传输带来了无尽的麻烦。分析了垃圾邮件产生的因素和发送的方法,阐述了关联规则挖掘的方法,通过对邮件文本的分类处理,利用关联规则挖掘对垃圾邮件进行识别过滤。 相似文献