共查询到20条相似文献,搜索用时 15 毫秒
1.
简单贝叶斯算法在邮件过滤领域使用得比较普遍.该算法的优点是简单、对特征较为恒定的垃圾邮件较为有效,但其适应性较差.谨提出一种以贝叶斯公式为基础的自适应垃圾邮件过滤方法,它采用基于词熵的特征提取方法,在过滤过程中不断地进行自学习,具有较强的自适应能力. 相似文献
2.
介绍贝叶斯方法的理论依据及近几年的典型贝叶斯分类方法,并给出不同方法下垃圾邮件过滤实验数据对比,总结贝叶斯方法在垃圾邮件处理中的优点和局限性,并提出下一步可能的研究方向. 相似文献
3.
基于贝叶斯理论的垃圾邮件过滤技术 总被引:12,自引:0,他引:12
垃圾邮件已成为损耗生产力的问题,反垃圾邮件技术不断出现,基于贝叶斯理论的垃圾邮件过滤技术有其独特的优势,研究针对中文的贝叶斯垃圾邮件过滤技术具有理论和现实的意义。 相似文献
4.
介绍了一个改进的基于贝叶斯分类技术的垃圾邮件过滤器的系统结构,完成了系统的整体设计和实现。提出了一种改进的邮件信息增益方法,选取多个样本进行实验比较分析,提高了贝叶斯分类器的性能。 相似文献
5.
6.
7.
基于内容的垃圾邮件过滤技术综述 总被引:67,自引:3,他引:67
垃圾邮件问题日益严重,受到研究人员的广泛关注。基于内容的过滤是当前解决垃圾邮件问题的主流技术之一。目前基于内容的垃圾邮件过滤主要包括基于规则的方法和基于概率统计的方法。本文综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,并总结了目前使用的垃圾邮件过滤技术以及它们之间的对比实验,包括Ripper、决策树、Rough Set 、Rocchio 、Boosting、Bayes、kNN、SVM、Winnow 等等。实验结果表明,Boosting、Flexible Bayes、SVM、Winnow 方法是目前较好的垃圾邮件过滤方法,它们在评测语料上的结果已经达到很高水平,但是,要走向真正实用化,还有很多的工作要做。 相似文献
8.
9.
朴素贝叶斯分类器在处理垃圾邮件过滤任务时,往往存在数据稀疏问题。由于语料库中特征出现遵循Zipf定律,所以单纯依靠增加训练语料方式难以解决该问题。为克服数据稀疏问题,引入数据平滑算法计算贝叶斯模型中缺失特征的补偿概率。通过领域术语抽取与概念相关模型增加分类中语义知识处理能力。采用增量式学习方法完成动态在线学习过程。Ling-Spam垃圾邮件语料库实验表明该方法提高分类精度2.51%,在国家863语料表明该方法比Laplace原则提高了3.05%。 相似文献
10.
一种基于多贝叶斯算法的垃圾邮件过滤方法 总被引:5,自引:0,他引:5
贝叶斯算法在垃圾邮件过滤中应用广泛。针对算法提高精确率和召回率的矛盾,提出了一种新的基于多贝叶斯算法组合的垃圾邮件过滤方法,并给出了不同方法下中、英文垃圾邮件过滤实验数据对比。实验表明该方法显著提高了垃圾邮件的过滤性能。 相似文献
11.
12.
本文介绍了基于贝叶斯理论的实现垃圾邮件过滤的方法,详细介绍了贝叶斯理论及实现方法. 相似文献
13.
基于内容的垃圾邮件过滤问题是Internet安全技术研究的一个重点问题,而基于贝叶斯的分类方法在垃圾邮件处理上表现出了很高的准确度,因此受到了广泛的关注。在朴素贝叶斯算法的基础上,提出了一种基于最小风险贝叶斯方法同Boosting算法相结合的邮件过滤改进算法,提高了分类的精确度。实验证明,算法在邮件过滤中有更好的表现。 相似文献
14.
中文垃圾邮件过滤综合方法 总被引:1,自引:0,他引:1
随着电子邮件在人们生活中的广泛应用,垃圾邮件的危害也日益引起人们的重视。目前,已经有一些过滤系统在英文环境中取得了较好的过滤效果,但在中文环境中,过滤效果不够理想。针对中文垃圾邮件,提出一种将基于IP的白名单过滤、基于规则的SpamAssassin过滤、基于统计的贝叶斯过滤结合在一起的垃圾邮件综合过滤方法,并在Linux下的实验中取得良好的过滤效果。 相似文献
15.
分析了贝叶斯分类方法在中文垃圾邮件过滤中的应用。提出了基于贝叶斯最小风险的垃圾邮件过滤技术,通过选择适当的损失函数,尽可能减少合法邮件的误判。实验结果表明,该方法是切实可行的并具有良好的效果。 相似文献
16.
基于内容的垃圾邮件过滤问题是Internet安全技术研究的一个重点问题,而基于贝叶斯的分类方法在垃圾邮件处理上表现了很高的准确度,因此受到了广泛的关注。本文将一种基于模拟退火遗传算法的贝叶斯分类方法引入到中文垃圾邮件过滤中,提高了分类的精确度。实验证明,算法在邮件过滤中有更好的表现。 相似文献
17.
用贝叶斯算法实现垃圾邮件过滤 总被引:2,自引:0,他引:2
本文论述了一种采用贝叶斯过滤算法实现的垃圾邮件过滤系统,并在Windows平台下用VC++实现。系统工作在邮件客户端和邮件服务器之间,基于邮件内客的解析,可以有效地过滤和分离用户的垃圾邮件。 相似文献
18.
本文介绍了一种朴素贝叶斯算法的实现方法,并介绍了涉及到的文本特征选取、朴素贝叶斯分类器等关键技术.最后,文章给出了垃圾邮件过滤的实验结果.结果表明,该方法对于垃圾邮件的识别,具有良好的效果. 相似文献
19.
运用TEIRESIAS算法从邮件中提取模式作为表示邮件的属性,在此基础上实现了一个贝叶斯垃圾邮件过滤实验系统。通过实验,比较分析了该过滤器的性能,并讨论了属性集大小、属性最少出现次数对基于模式的贝叶斯垃圾邮件过滤系统的影响。 相似文献
20.
朴素贝叶斯算法在垃圾邮件过滤领域得到了广泛应用,该算法中,特征提取是一个必不可少的环节。过去针对中文的垃圾邮件过滤方法都以词作为文本的特征项单位进行提取,面对大规模的邮件训练样本,这种算法的时间效率会成为邮件过滤技术中的一个瓶颈。对此,提出一种基于短语的贝叶斯中文垃圾邮件过滤方法,在特征项提取阶段结合文本分类领域提出的新的短语分析方法,按照基本名词短语、基本动词短语、基本语义分析规则,以短语为单位进行提取。通过分别以词和短语为单位进行垃圾邮件过滤的对比测试实验证实了所提出方法的有效性。 相似文献