共查询到19条相似文献,搜索用时 140 毫秒
1.
基于贝叶斯神经网络的垃圾邮件过滤方法 总被引:12,自引:2,他引:10
垃圾邮件过滤是当前互联网应用中急需解决的一个重要课题,日益受到人们的关注。本文提出了一种基于贝叶斯神经网络BNN(Bayesian Neural Network)的垃圾邮件过滤方法,利用贝叶斯推理和神经网络相结合的贝叶斯神经网络算法对用户给定的正常/垃圾邮件集合进行训练,得到邮件过滤模型。并且提出了一种有效的特征选择方法,采用信息增益准则,有效降低了特征维数。经过实验测试,本文提出的方法可以实现对垃圾邮件的有效过滤。 相似文献
2.
基于词条时序的朴素贝叶斯垃圾邮件过滤方法 总被引:1,自引:0,他引:1
常青 《微电子学与计算机》2010,27(5)
朴素贝叶斯分类算法是一种有效的垃圾邮件过滤技术.互联网上的信息随着时间推移产生概念的变迁,最近出现的垃圾邮件词条可作为判定垃圾邮件的重要依据.将新近的垃圾邮件词条单独记录,在进行邮件分类时,对于最近出现的垃圾词条,提高其对垃圾邮件判定的先验概率.通过实验对比,提出的垃圾邮件过滤方法较传统的朴素贝叶斯垃圾邮件过滤具有更高的准确性、精确性和召回率. 相似文献
3.
自从互联网普及以来,电子邮件逐渐成为人们生活中便捷的通信手段之一。但随之产生的垃圾邮件泛滥成灾,垃圾邮件过滤技术逐渐成为网络信息安全研究领域的热点。本文首先对垃圾邮件过滤技术研究发展阶段作简要说明,然后从内容过滤、接入过滤、行为过滤等三方面对垃圾邮件过滤技术的研究现状进行综述,最后介绍现有过滤方案,同时讨论目前研究中遇的问题和挑战,并对未来的研究方向进行预测。 相似文献
4.
自从互联网普及以来,电子邮件逐渐成为人们生活中便捷的通信手段之一。但随之产生的垃圾邮件泛滥成灾,垃圾邮件过滤技术逐渐成为网络信息安全研究领域的热点。本文首先对垃圾邮件过滤技术研究发展阶段作简要说明,然后从内容过滤、接入过滤、行为过滤等三方面对垃圾邮件过滤技术的研究现状进行综述,最后介绍现有过滤方案,同时讨论目前研究中遇的问题和挑战,并对未来的研究方向进行预测。 相似文献
5.
针对目前互联网垃圾邮件日益泛滥的情况,对目前常用的几种抗击垃圾邮件方法进行了介绍,同时提出一种混合型的垃圾邮件过滤系统,对其进行了详细地阐述。该方法结合贝叶斯理论和基于内容的邮件过滤思想,给出了邮件过滤系统的体系结构,并对其算法进行了分析。 相似文献
6.
随着电子邮件日益广泛的使用,如何有效地避免和防范垃圾邮件的侵扰已成为一个亟待解决的问题.受生物免疫系统自我保护机制的启发,本文提出了一种基于人工免疫的多层垃圾邮件过滤算法,利用分层检测的思想来过滤垃圾邮件.文中给出了针对多层过滤算法中获得性免疫层的垃圾邮件过滤测试实验,实验结果表明本算法在垃圾邮件过滤中能得到较高的召回率、精确率和正确率.文中也指出了可以通过合理地设置各检测器层之间的与或关系来得到更好的垃圾邮件过滤效果. 相似文献
7.
8.
9.
10.
11.
针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集作为检测器,新增样本集作为自体集,对两者进行异常匹配.本文算法与在线垃圾邮件快速识别方法、增强差异性的半监督协同分类算法、垃圾邮件过滤方法、基于人工高免疫的多层垃圾邮件过滤算法和在线主动多领域学习方法在六个常用邮件语料集上进行了分析比较,结果表明本文算法具有较高的准确率、召回率、分类精度,和较低的用户标注负担.使用用户个性喜好转换为双向兴趣特征的方式有助于提高算法的分类能力;利用异常检测匹配选取未知类别特征的方式,有效地降低了用户标注负担. 相似文献
12.
As a response to the increasing number of cyber threats, novel detection and prevention methods are constantly being developed. One of the main obstacles hindering the development and evaluation of such methods is the shortage of reference data sets. What is proposed in this work is a way of testing methods detecting network threats. It includes a procedure for creating realistic reference data sets describing network threats and the processing and use of these data sets in testing environments. The proposed approach is illustrated and validated on the basis of the problem of spam detection. Reference data sets for spam detection are developed, analysed and used to both generate the requested volume of simulated traffic and analyse it using machine learning algorithms. The tests take into account both the accuracy and performance of threat detection methods under real load and constrained computing resources. 相似文献
13.
This paper proposes a novel approach to comment spam identification based on content analysis. Three main features including the number of links, content repetitiveness, and text similarity are used for comment spam identification. In practice, content repetitiveness is determined by the length and frequency of the longest common substring. Furthermore, text similarity is calculated using vector space model. The precisions of preliminary experiments on comment spam identification con-ducted on Chinese and English are as high as 93% and 82% respectively. The results show the validity and language independency of this approach. Compared with conventional spam filtering approaches,our method requires no training, no rule sets and no link relationships. The proposed approach can also deal with new comments as well as existing comments. 相似文献
14.
近年来,垃圾短消息呈现出包含大量拆分字、形近字现象,这种短消息可以绕过监控系统的关键词审查。由于拆分字、形近字数量众多、变化灵活,将其加入关键词库将使得关键词库冗余。对此,本文提出了一种基于汉字笔顺特征的关键词变体匹配方法,基于汉字笔顺特征,首先合并垃圾短消息中的拆分字,然后通过建立索引查找短消息中包含的疑似关键词,最后提出了“金字塔匹配法”匹配关键词。本文提出的方法有效降低了关键词库的冗余度,提高了关键词匹配效率。 相似文献
15.
16.
文中旨在研究基于深度学习的垃圾邮件文本分类方法,该方法结合了卷积神经网络(CNN)和循环神经网络(RNN)的模型,通过对邮件文本进行特征提取和分类,能高效、准确地对垃圾邮件进行分类。文中以卷积神经网络和循环神经网络为实验对象,提出了一种垃圾邮件文本分类方法,并在公开数据集上进行了实验。实验结果表明,该方法在垃圾邮件文本分类任务上具有较高的准确率和召回率。 相似文献
17.
为了逃避基于文本的垃圾邮件系统的检测,越来越多的垃圾邮件制造者将文本信息嵌入到图像中。为了有效地检测出图像型垃圾邮件,提出了一种基于灰度—梯度共生矩阵(GGCM, gray-gradient co-occurrence matrix)的图像型垃圾邮件识别方法。先通过灰度—梯度共生矩阵提取图像的特征信息,然后运用最小二乘支持向量机(LS-SVM, least squares support vector machines)进行分类。实验表明,该方法具有较高的分类精度和较好的实时性。 相似文献
18.
为有效整治垃圾短信,不断提升不良信息治理的精准性,文章基于XGBoost算法构建了一套科学的分层分级垃圾短信治理体系。通过对用户入网、消费、通信行为等特征进行建模与运算,识别出用户发送垃圾短信的风险系数,并定义了六级用户。分级名单生成后,依托于垃圾短信拦截系统的分级策略管理功能,分别设置相匹配的拦截策略。在加大对中高危用户的识别和拦截力度的同时,有效降低了高价值用户因不良信息治理导致被误拦截的风险。该治理体系应用于辽宁移动管理实际以来,垃圾短信平均投诉量降幅34.82%。误关停投诉率稳定在0.1%以内。一至三级高价值客户群关停投诉量降幅27.43%。 相似文献
19.
YUXiao-hua XIANGYu-qun 《半导体技术》2005,30(2):30-32,37
An improving utilization and efficiency of critical equipments in semiconductor wafer fabrication facilities are concerned. Semiconductor manufacturing FAB is one of the most complicated and cost sensitive environments. A good dispatching tool will make big difference in equipment utilization and FAB output as a whole. The equipment in this paper is In-Line DUV Scanner. There are many factors impacting utilization and output on this equipment group. In HMP environment one of the issues is changing of reticule in this area and idle counts due to load unbalance between equipments. Here we'll introduce a rule-based RTD system which aiming at decreasing the number of recipe change and idle counts among a group of scanner equipment in a high-mixed-products FAB. 相似文献