首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
基于贝叶斯神经网络的垃圾邮件过滤方法   总被引:12,自引:2,他引:10  
垃圾邮件过滤是当前互联网应用中急需解决的一个重要课题,日益受到人们的关注。本文提出了一种基于贝叶斯神经网络BNN(Bayesian Neural Network)的垃圾邮件过滤方法,利用贝叶斯推理和神经网络相结合的贝叶斯神经网络算法对用户给定的正常/垃圾邮件集合进行训练,得到邮件过滤模型。并且提出了一种有效的特征选择方法,采用信息增益准则,有效降低了特征维数。经过实验测试,本文提出的方法可以实现对垃圾邮件的有效过滤。  相似文献   

2.
基于词条时序的朴素贝叶斯垃圾邮件过滤方法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法是一种有效的垃圾邮件过滤技术.互联网上的信息随着时间推移产生概念的变迁,最近出现的垃圾邮件词条可作为判定垃圾邮件的重要依据.将新近的垃圾邮件词条单独记录,在进行邮件分类时,对于最近出现的垃圾词条,提高其对垃圾邮件判定的先验概率.通过实验对比,提出的垃圾邮件过滤方法较传统的朴素贝叶斯垃圾邮件过滤具有更高的准确性、精确性和召回率.  相似文献   

3.
自从互联网普及以来,电子邮件逐渐成为人们生活中便捷的通信手段之一。但随之产生的垃圾邮件泛滥成灾,垃圾邮件过滤技术逐渐成为网络信息安全研究领域的热点。本文首先对垃圾邮件过滤技术研究发展阶段作简要说明,然后从内容过滤、接入过滤、行为过滤等三方面对垃圾邮件过滤技术的研究现状进行综述,最后介绍现有过滤方案,同时讨论目前研究中遇的问题和挑战,并对未来的研究方向进行预测。  相似文献   

4.
自从互联网普及以来,电子邮件逐渐成为人们生活中便捷的通信手段之一。但随之产生的垃圾邮件泛滥成灾,垃圾邮件过滤技术逐渐成为网络信息安全研究领域的热点。本文首先对垃圾邮件过滤技术研究发展阶段作简要说明,然后从内容过滤、接入过滤、行为过滤等三方面对垃圾邮件过滤技术的研究现状进行综述,最后介绍现有过滤方案,同时讨论目前研究中遇的问题和挑战,并对未来的研究方向进行预测。  相似文献   

5.
针对目前互联网垃圾邮件日益泛滥的情况,对目前常用的几种抗击垃圾邮件方法进行了介绍,同时提出一种混合型的垃圾邮件过滤系统,对其进行了详细地阐述。该方法结合贝叶斯理论和基于内容的邮件过滤思想,给出了邮件过滤系统的体系结构,并对其算法进行了分析。  相似文献   

6.
一种基于人工免疫的多层垃圾邮件过滤算法   总被引:6,自引:0,他引:6       下载免费PDF全文
张泽明  罗文坚  王煦法 《电子学报》2006,34(9):1616-1620
随着电子邮件日益广泛的使用,如何有效地避免和防范垃圾邮件的侵扰已成为一个亟待解决的问题.受生物免疫系统自我保护机制的启发,本文提出了一种基于人工免疫的多层垃圾邮件过滤算法,利用分层检测的思想来过滤垃圾邮件.文中给出了针对多层过滤算法中获得性免疫层的垃圾邮件过滤测试实验,实验结果表明本算法在垃圾邮件过滤中能得到较高的召回率、精确率和正确率.文中也指出了可以通过合理地设置各检测器层之间的与或关系来得到更好的垃圾邮件过滤效果.  相似文献   

7.
垃圾邮件具有特征维数高、样本不平衡等特点,针对近邻算法(KNN)或支持向量机(SVM)存在虚警率高等难题,基于组合优化理论,提出基于KNN-SVM的垃圾邮件过滤组合模型。首先提取垃圾邮件的特征项,并构建垃圾邮件过滤模型的输入向量,然后采用KNN对垃圾邮件训练样本进行选择,将训练样本缩减到k个,并采用支持向量机对k个样本训练和建模进行垃圾邮件过滤,最后采用中文邮件集对KNN-SVM的性能进行分析。结果表明,KNN-SVM提高了垃圾邮件过滤的准确率,大幅度降低了虚警率,而且垃圾邮件的过滤速度可以满足邮件处理的在线需求。  相似文献   

8.
王彤彤  韩文报  窦勇 《通信技术》2007,40(12):299-301
随着互联网的发展,电子邮件成为了一类重要应用。然而垃圾邮件的产生极大的制约了电子邮件的应用。文中提出了一类基于矢量空间模型的垃圾邮件去重复技术(VMF),从删除重复邮件的角度,给出了一种垃圾邮件过滤的方法。与现存技术相比,VMF在召回率和适应性等方面均有显著提高。  相似文献   

9.
由于电子邮件在互联网上的广泛应用,出现了垃圾邮件的泛滥和占用网络带宽,垃圾邮件给用户正常收发邮件造成了严重困扰。提出了一种新的基于兴趣相似度的协作式邮件过滤方案,使得兴趣相似的用户迅速聚合成信息共享的团体,每个用户在团体内选择出最合适的过滤规则集进行有效的共享。实验表明,该方案在保持一定的过滤精度的同时有效降低了误判率。  相似文献   

10.
目前对于大量垃圾邮件问题尚没有十分有效的解决办法。垃圾邮件的传播者总会以不同的方式绕过邮件过滤器而到达用户的邮箱。研究本题目就是为了建立一套类似于网络防火墙的设备,以高效、准确地过滤垃圾邮件,净化网络环境。  相似文献   

11.
基于主动学习和否定选择的垃圾邮件分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
胡小娟  刘磊  邱宁佳 《电子学报》2018,46(1):203-209
针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集作为检测器,新增样本集作为自体集,对两者进行异常匹配.本文算法与在线垃圾邮件快速识别方法、增强差异性的半监督协同分类算法、垃圾邮件过滤方法、基于人工高免疫的多层垃圾邮件过滤算法和在线主动多领域学习方法在六个常用邮件语料集上进行了分析比较,结果表明本文算法具有较高的准确率、召回率、分类精度,和较低的用户标注负担.使用用户个性喜好转换为双向兴趣特征的方式有助于提高算法的分类能力;利用异常检测匹配选取未知类别特征的方式,有效地降低了用户标注负担.  相似文献   

12.
As a response to the increasing number of cyber threats, novel detection and prevention methods are constantly being developed. One of the main obstacles hindering the development and evaluation of such methods is the shortage of reference data sets. What is proposed in this work is a way of testing methods detecting network threats. It includes a procedure for creating realistic reference data sets describing network threats and the processing and use of these data sets in testing environments. The proposed approach is illustrated and validated on the basis of the problem of spam detection. Reference data sets for spam detection are developed, analysed and used to both generate the requested volume of simulated traffic and analyse it using machine learning algorithms. The tests take into account both the accuracy and performance of threat detection methods under real load and constrained computing resources.  相似文献   

13.
This paper proposes a novel approach to comment spam identification based on content analysis. Three main features including the number of links, content repetitiveness, and text similarity are used for comment spam identification. In practice, content repetitiveness is determined by the length and frequency of the longest common substring. Furthermore, text similarity is calculated using vector space model. The precisions of preliminary experiments on comment spam identification con-ducted on Chinese and English are as high as 93% and 82% respectively. The results show the validity and language independency of this approach. Compared with conventional spam filtering approaches,our method requires no training, no rule sets and no link relationships. The proposed approach can also deal with new comments as well as existing comments.  相似文献   

14.
近年来,垃圾短消息呈现出包含大量拆分字、形近字现象,这种短消息可以绕过监控系统的关键词审查。由于拆分字、形近字数量众多、变化灵活,将其加入关键词库将使得关键词库冗余。对此,本文提出了一种基于汉字笔顺特征的关键词变体匹配方法,基于汉字笔顺特征,首先合并垃圾短消息中的拆分字,然后通过建立索引查找短消息中包含的疑似关键词,最后提出了“金字塔匹配法”匹配关键词。本文提出的方法有效降低了关键词库的冗余度,提高了关键词匹配效率。  相似文献   

15.
陈侃  陈亮  朱培栋  熊岳山 《通信学报》2015,36(7):120-128
网络水军对广告、谣言、木马和恶意链接进行传播,不仅干扰用户对在线社会网络的正常访问,还可能引发网络安全、社会稳定等方面的问题。针对网络水军信息传播的特点,提出基于交互行为的信息传播模型。模型根据不同传播主体间的交互定义特征来量化传播行为,使用决策树方法对水军传播的信息进行检测。通过新浪微博的真实数据分析传播模型并验证检测方法,结果表明检测方法能够对微博中水军信息进行有效检测。  相似文献   

16.
张天润 《移动信息》2023,45(10):167-169
文中旨在研究基于深度学习的垃圾邮件文本分类方法,该方法结合了卷积神经网络(CNN)和循环神经网络(RNN)的模型,通过对邮件文本进行特征提取和分类,能高效、准确地对垃圾邮件进行分类。文中以卷积神经网络和循环神经网络为实验对象,提出了一种垃圾邮件文本分类方法,并在公开数据集上进行了实验。实验结果表明,该方法在垃圾邮件文本分类任务上具有较高的准确率和召回率。  相似文献   

17.
为了逃避基于文本的垃圾邮件系统的检测,越来越多的垃圾邮件制造者将文本信息嵌入到图像中。为了有效地检测出图像型垃圾邮件,提出了一种基于灰度—梯度共生矩阵(GGCM, gray-gradient co-occurrence matrix)的图像型垃圾邮件识别方法。先通过灰度—梯度共生矩阵提取图像的特征信息,然后运用最小二乘支持向量机(LS-SVM, least squares support vector machines)进行分类。实验表明,该方法具有较高的分类精度和较好的实时性。  相似文献   

18.
为有效整治垃圾短信,不断提升不良信息治理的精准性,文章基于XGBoost算法构建了一套科学的分层分级垃圾短信治理体系。通过对用户入网、消费、通信行为等特征进行建模与运算,识别出用户发送垃圾短信的风险系数,并定义了六级用户。分级名单生成后,依托于垃圾短信拦截系统的分级策略管理功能,分别设置相匹配的拦截策略。在加大对中高危用户的识别和拦截力度的同时,有效降低了高价值用户因不良信息治理导致被误拦截的风险。该治理体系应用于辽宁移动管理实际以来,垃圾短信平均投诉量降幅34.82%。误关停投诉率稳定在0.1%以内。一至三级高价值客户群关停投诉量降幅27.43%。  相似文献   

19.
An improving utilization and efficiency of critical equipments in semiconductor wafer fabrication facilities are concerned. Semiconductor manufacturing FAB is one of the most complicated and cost sensitive environments. A good dispatching tool will make big difference in equipment utilization and FAB output as a whole. The equipment in this paper is In-Line DUV Scanner. There are many factors impacting utilization and output on this equipment group. In HMP environment one of the issues is changing of reticule in this area and idle counts due to load unbalance between equipments. Here we'll introduce a rule-based RTD system which aiming at decreasing the number of recipe change and idle counts among a group of scanner equipment in a high-mixed-products FAB.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号