首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
针对目前互联网垃圾邮件日益泛滥的情况,对目前常用的几种抗击垃圾邮件方法进行了介绍,同时提出一种混合型的垃圾邮件过滤系统,对其进行了详细地阐述。该方法结合贝叶斯理论和基于内容的邮件过滤思想,给出了邮件过滤系统的体系结构,并对其算法进行了分析。  相似文献   

2.
如何在传统垃圾邮件过滤技术基础上实现垃圾邮件个性化过滤是垃圾邮件过滤领域的重要课题。提出一种基于用户反馈的个性化垃圾邮件过滤方法,一方面将用户反馈应用于邮件分类特征的更新,提取用户个性化邮件分类标准;另一方面,将全局邮件分类标准和用户个性化分类标准综合应用于朴素贝叶斯分类过程,实现用户邮件个性化分类。仿真实验结果表明,在用户邮件分类标准存在差异的环境下,基于用户反馈的个性化垃圾邮件过滤方法能够有效提升传统垃圾邮件过滤技术的邮件分类效果。  相似文献   

3.
基于文本分类技术的垃圾邮件识别系统   总被引:7,自引:0,他引:7  
文章介绍了一个基于文本分类技术识别垃圾邮件系统的体系结构,并介绍了该系统涉及到的中文信息处理、文本特征选取、朴素贝叶斯分类器等关键技术。最后,文章给出了针对部分垃圾邮件的处理结果。结果表明,该方法对于垃圾邮件的识别,具有较好的效果。  相似文献   

4.
一种基于N-gram组合的中文垃圾邮件过滤方法   总被引:3,自引:0,他引:3  
中文垃圾邮件的泛滥提出了极为迫切的技术诉求。本文使用了基于简单贝叶斯模型的过滤算法,同时使用N-gram对中文文本进行自动分词,并且组合多个N-gram来加快分类的收敛速度,这样分类是一种切实可行的垃圾邮件过滤方法。对于这种代价敏感性(cost sensitive)的分类,通过移动门限值的方法来处理:在评估结果时采用了TCR以及召回率(SR)和正确率(SP)等参数考察实验数据。实验表明:这种方法代价较小,而正确率较高。最后我们认为可以通过筛选训练邮件以及和其它措施相结合来满足ISP级别等应用场合的要求。  相似文献   

5.
垃圾邮件过滤技术研究   总被引:1,自引:0,他引:1  
姜兰  杨悦 《现代电子技术》2006,29(15):143-146
电子邮件成为人们相互联系的一种重要方式,同时由于其本身所具有的开放性、低成本等特点使其成为无孔不入的垃圾邮件的一种重要传播途径。为了对抗日益泛滥的垃圾邮件,人们找到了许多方法,在分析了当前主流的反垃圾邮件方法,并比较几种方法优缺点的基础上,设计、实现了反垃圾邮件过滤软件。  相似文献   

6.
基于贝叶斯方法的一种垃圾邮件过滤的实现   总被引:2,自引:1,他引:1  
随着Internet的迅速发展,电子邮件的应用变得十分广泛,但是许多无用、有害的信息也随之而来。文章通过对垃圾邮件的分析与处理,运用贝叶斯方法建立一个自适应性又能够个性化的自动邮件过滤系统。该系统可以较为容易地识别出垃圾邮件,降低误判率。  相似文献   

7.
基于贝叶斯神经网络的垃圾邮件过滤方法   总被引:10,自引:2,他引:10  
垃圾邮件过滤是当前互联网应用中急需解决的一个重要课题,日益受到人们的关注。本文提出了一种基于贝叶斯神经网络BNN(Bayesian Neural Network)的垃圾邮件过滤方法,利用贝叶斯推理和神经网络相结合的贝叶斯神经网络算法对用户给定的正常/垃圾邮件集合进行训练,得到邮件过滤模型。并且提出了一种有效的特征选择方法,采用信息增益准则,有效降低了特征维数。经过实验测试,本文提出的方法可以实现对垃圾邮件的有效过滤。  相似文献   

8.
以朴素贝叶斯理论作为基石并结合信息增益、代价因子等方法,尝试设计一种基于用户需求的垃圾邮件过滤分类模型,在垃圾邮件一次分类基础上提出邮件先过滤后分类方法,进而改进传统邮件分类一次阈值比较,变为两次阈值比较,且应用反馈技术以应对垃圾邮件的日益变化.该模型可能会对垃圾邮件多分类研究具有一定的参考价值.  相似文献   

9.
垃圾邮件过滤技术分析   总被引:9,自引:0,他引:9  
徐洪伟  方勇  音春 《通信技术》2003,(10):126-128
主要介绍基于邮件的过滤技术,对目前邮件过滤采用的模式———单机模式和将来可能采用的模式———网络模式做了个评估,并重点介绍了在单机模式中的一种基于邮件内容的过滤算法———贝叶斯算法,以及这种算法的不足和改进。  相似文献   

10.
垃圾邮件具有特征维数高、样本不平衡等特点,针对近邻算法(KNN)或支持向量机(SVM)存在虚警率高等难题,基于组合优化理论,提出基于KNN-SVM的垃圾邮件过滤组合模型。首先提取垃圾邮件的特征项,并构建垃圾邮件过滤模型的输入向量,然后采用KNN对垃圾邮件训练样本进行选择,将训练样本缩减到k个,并采用支持向量机对k个样本训练和建模进行垃圾邮件过滤,最后采用中文邮件集对KNN-SVM的性能进行分析。结果表明,KNN-SVM提高了垃圾邮件过滤的准确率,大幅度降低了虚警率,而且垃圾邮件的过滤速度可以满足邮件处理的在线需求。  相似文献   

11.
The data is noisy and diverse,with a large number of meaningless topics in social network.The traditional method of bursty topic discovery cannot solve the sparseness problem in social network,and require complicated post-processing.In order to tackle this problem,a bursty topic discovery method based on recurrent neural network and topic model was proposed.Firstly,the weight prior based on RNN and IDF were constructed to learn the relationship between words.At the same time,the word pairs were constructed to solve the sparseness problem.Secondly,the “spike and slab” prior was introduced to decouple the sparsity and smoothness of the bursty topic distribution.Finally,the burstiness of words were leveraged to model the bursty topic and the common topic,and automatically discover the bursty topics.To evaluate the effectiveness of proposed method,the various experiments were conducted.Both qualitative and quantitative evaluations demonstrate that the proposed RTM-SBTD method outperforms favorably against several state-of-the-art methods.  相似文献   

12.
信息增益是文本分类中一种有效的特征项选择方法,针对垃圾邮件过滤中的特征项选择问题,提出了一种改进的信息增益方法提取特征词,并采用了最小风险贝叶斯的决策方法,最后在英文语料库上进行实验,实验结果表明改进后的方法降低了过滤器对合法邮件的误判。  相似文献   

13.
李慧  施荣华 《信息技术》2007,31(12):73-76
网页过滤系统旨在帮助用户屏蔽不健康的网页。提出了基于混合模式的网页过滤模型,将传统的基于网址过滤和敏感词过滤的方法与基于文本分类的过滤方法结合起来。重点讨论了特征量选取、网页结构化信息利用等方面的改进措施。实验表明这种模型在保持易于实现的特点的同时,在速度和准确度方面都有不同程度的提高。  相似文献   

14.
随着移动网络的发展,垃圾短信已经成为亟需解决的重要课题.当前的垃圾短信过滤技术在应用于大规模垃圾短信过滤时,很难兼顾过滤的准确性和实时性要求.本文针对垃圾短信的特点,提出一种基于行为和内容协作分析的垃圾短信过滤机制并构建了原型系统.为了提升过滤及时性和过滤效果,采用行为分析为主、内容分析为辅的策略,并引入概率理论对归一...  相似文献   

15.
A method of improved support vector machine naive Bayes algorithm was proposed——TSVM-NB algorithm.  相似文献   

16.
汪少敏  杨迪  任华 《电信科学》2018,34(12):117-124
大数据时代,文本分类是文本数据挖掘和文本价值探索领域的重要工作。传统的文本分类系统存在特征提取能力弱、分类准确率不高的问题。相对于传统的文本分类技术,深度学习技术具有准确率高、特征提取有效等诸多优势,有必要将深度学习技术引入文本分类系统,以解决传统文本分类系统存在的问题。在分析传统文本分类系统的基础上,提出了基于深度学习的文本分类系统的体系架构和关键技术,同时对传统分类模型、TextCNN、CNN+LSTM多种分类模型进行了验证比对。  相似文献   

17.
本文基于生物免疫系统防御机制,探讨了将人工免疫原理应用于垃圾邮件过滤系统(IDSFS),通过动态生成垃圾邮件疫苗,提高系统的检出率.另外,针对传统邮件过滤系统存在的错误肯定率、错误否定率等不足及用户对邮件个性化处理的要求,引入用户反馈机制,使得系统精确率、正确率进一步提高.实验结果表明,该系统具有较强的自学习、自适应能力.  相似文献   

18.
针对现有微博网络舆情分析的研究中没有从全局层面考虑舆情文本特征的情况,结合微博网络舆情的主题及趋向性分析,提出了基于主题发现的微博网络舆情分析模型,从文本预处理、微博文本特征提取、微博舆情的主题发现及趋向性分析三方面进行了具体描述。仿真结果表明,基于该模型实现的微博网络舆情分析方法在微博网络舆情的分析处理中检测效果良好,说明该模型有效。相关内容可为该领域的进一步研究提供有价值的参考。  相似文献   

19.
本文简要介绍了垃圾短信对社会带来的负面影响,分析了目前垃圾短信治理体系存在的不足,提出了基于大数据挖掘分析的垃圾短信治理方案:首先构建垃圾短信用户识别指标体系,通过引入随机森林模型,对垃圾短信用户进行识别和有效治理,最后运用平台对垃圾短信用户进行精细化管理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号