首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
一种基于多贝叶斯算法的垃圾邮件过滤方法   总被引:5,自引:0,他引:5  
贝叶斯算法在垃圾邮件过滤中应用广泛。针对算法提高精确率和召回率的矛盾,提出了一种新的基于多贝叶斯算法组合的垃圾邮件过滤方法,并给出了不同方法下中、英文垃圾邮件过滤实验数据对比。实验表明该方法显著提高了垃圾邮件的过滤性能。  相似文献   

2.
中文垃圾邮件过滤综合方法   总被引:1,自引:0,他引:1  
随着电子邮件在人们生活中的广泛应用,垃圾邮件的危害也日益引起人们的重视。目前,已经有一些过滤系统在英文环境中取得了较好的过滤效果,但在中文环境中,过滤效果不够理想。针对中文垃圾邮件,提出一种将基于IP的白名单过滤、基于规则的SpamAssassin过滤、基于统计的贝叶斯过滤结合在一起的垃圾邮件综合过滤方法,并在Linux下的实验中取得良好的过滤效果。  相似文献   

3.
龚伟 《微计算机信息》2007,23(3):104-106
文章首先分析了垃圾邮件的产生机理,介绍了目前比较常见的几种垃圾邮件过滤技术,然后从朴素贝叶斯的理论依据出发,针对当前应用于重要商业领域的垃圾邮件过滤系统的不足,设计了一种应用多级邮件策略的新模型,并通过实验比较证明新模型的应用在一定程度上提高了垃圾邮件过滤系统的查全率和查准率。  相似文献   

4.
本文介绍了后缀数组和广义后缀数组的概念,然后提出了一种类似桶排序的广义后缀数组的高效构造算法,并对算法的复杂度进行了分析.  相似文献   

5.
谭建龙  张吉  郭莉 《计算机工程》2007,33(9):100-102
采用通用后缀树模型(GSTM),利用邮件内容的上下文信息,进行每个文本位置的不定长多元统计,从而获得被测邮件与不同训练集的相似程度,确定邮件所属的类别。理论分析和实验表明,在相同语料上,该方法的精确度和召回率均达到或超过了基于向量空间模型的邮件过滤方法;对于长度为N的邮件,过滤时间为O(N);长度为N的新邮件加入训练集,训练时间为O(N),满足了训练集的动态增长;该方法不需进行分词处理,完全独立于语种,适用于多语种邮件同时存在的情况。  相似文献   

6.
介绍现在普遍采用的几种垃圾邮件过滤方法,对基于内容的过滤方法中的贝叶斯算法和Winnow算法进行详细的介绍.目前研究中文垃圾邮件的各类文献都基于不同的语料库,缺乏算法之间的效果比较分析.分别实现贝叶斯和Winnow的改进算法,并对CCERT的一个公开邮件语料库进行测试.测试结果表明,两种算法都达到较好的过滤效果.  相似文献   

7.
众所周知,垃圾邮件问题已经是当今网络世界的一个严重问题。大量无用,甚至有害的信件在网络传播,不仅消耗了大量的网络资源,而且还严重威胁到邮件系统用户信息的安全。本文将用采用基于内容的文本检索过滤技术对电子邮件进行判别及分类.  相似文献   

8.
基于改进Na(i)ve Bayes的垃圾邮件过滤模型研究   总被引:2,自引:0,他引:2       下载免费PDF全文
分析了目前在垃圾邮件过滤中广泛应用的Na(i)ve Bayes过滤模型(NBF),指出了期望交叉熵(ECE)特征词选取方法的不足.提出了改进的Na(i)ve Bayes垃圾邮件过滤模型(A-NBF),用改进的期望交叉熵(AECE)选取垃圾邮件特征词,并在邮件分类过程中对特征词进行加权,从而提高对垃圾邮件过滤的精度.实验结果可以看出A-NBF比NBF在过滤精度方面有明显的提高.  相似文献   

9.
运用贝叶斯方法过滤垃圾邮件   总被引:1,自引:0,他引:1  
本文简单介绍了贝叶斯算法,以及如何运用贝叶斯方法过滤垃圾邮件,并对两种反垃圾邮件的方法:贝叶斯过滤法和关键字检测法进行了比较.  相似文献   

10.
大量垃圾邮件的出现给用户收发电子邮件带来极大困扰。贝叶斯算法由于在垃圾邮件处理上表现出很高的准确度,因此受到了广泛关注。本文介绍了贝叶斯算法的理论依据,分析了贝叶斯算法的优缺点,总结了贝叶斯的相关改进算法,最后对贝叶斯算法进行了总结和展望。  相似文献   

11.
王青松  魏如玉 《计算机科学》2016,43(4):256-259, 269
朴素贝叶斯算法在垃圾邮件过滤领域得到了广泛应用,该算法中,特征提取是一个必不可少的环节。过去针对中文的垃圾邮件过滤方法都以词作为文本的特征项单位进行提取,面对大规模的邮件训练样本,这种算法的时间效率会成为邮件过滤技术中的一个瓶颈。对此,提出一种基于短语的贝叶斯中文垃圾邮件过滤方法,在特征项提取阶段结合文本分类领域提出的新的短语分析方法,按照基本名词短语、基本动词短语、基本语义分析规则,以短语为单位进行提取。通过分别以词和短语为单位进行垃圾邮件过滤的对比测试实验证实了所提出方法的有效性。  相似文献   

12.
后缀数组构建算法的时间和空间开销是它在实际应用中的瓶颈。该文介绍了两种较好的构建算法,对它们的性能作了评估和分析,指出了各自的适用范围,给出并比较了两种算法在不同情况下的实验结果。  相似文献   

13.
刘德山 《计算机科学》2011,38(11):148-152
针对现有搜索结果分类算法在聚类标签筛选、聚类质量评估及控制重叠聚类方面的缺陷,提出了一种改进的基于向量空间模型与后缀树模型的检索结果聚类算法,从而完善了LINGO算法的聚类及聚类标签打分函数,增加了基本类合并过程,改善了对中文的处理效果。最后对算法的分类效果及产生标签的质量进了实验分析,基于carrot2框架,建立了Wcb搜索结果聚类推荐平台。验证了CQIG算法分类的准确性和聚类标签的区分性和可读性。  相似文献   

14.
基于压缩后缀数组技术的搜索引擎   总被引:1,自引:0,他引:1       下载免费PDF全文
目前,搜索引擎的核心模块(索引器)均采用倒排文件结构,对短语查询的准确率较低。该文引入后缀数组技术进行全文索引,为克服全文索引时占用空间大的缺点,研究了压缩后缀数组技术,把后缀数组索引的大小压缩到了O(n)位,并给出应用压缩后缀数组索引的步骤和核心操作伪代码。对比实验表明,基于压缩后缀数组的索引比传统倒排文件索引的短语查准率提高了近20%。  相似文献   

15.
基于模糊聚类的协同过滤推荐方法   总被引:9,自引:0,他引:9  
推荐系统是利用用户的历史偏好信息实现个性化服务的系统,它已经成为电子商务和信息获取领域中的重要应用。文中提出了一种通过模糊聚类的方法将项目属性特征的相似性与基于项目的协同过滤推荐技术相结合的推荐方法,首先应用模糊聚类技术对项目聚类,得到项目在属性特征上的相似关系群,然后与用户一项目评分矩阵中的协同相似关系群组合得到综合相似关系群,最后,利用综合相似关系群为目标用户推荐项目。实验结果表明,该方法不仅可有效改善基于项目的协同过滤推荐算法面临的“冷启动”问题,而且确实提高了推荐系统的推荐精度。  相似文献   

16.
基于协同过滤的垃圾邮件过滤系统   总被引:1,自引:0,他引:1       下载免费PDF全文
许志佴  邹恒明 《计算机工程》2008,34(23):153-154
针对当前垃圾邮件过滤技术中邮件性质评价难及邮件附件判断难的问题,提出协同过滤模型,设计一个多层次垃圾邮件过滤系统。该系统针对垃圾邮件一般群发给多人的特点,提取用户的操作和阅读速度进行反馈,利用他人的反馈结果进行协同过滤。实验和分析结果表明,协同过滤技术有效地提高了垃圾邮件过滤的召回率。  相似文献   

17.
邮件过滤技术,为用户提供更安全方便的网络使用的主要技术.采用Boosting技术实现对垃圾邮件的分类,基本分类器选用RBF网络,最终假设通过投票方式实现.实验结果表明该方法有更好的过滤效果.  相似文献   

18.
针对背景感知相关滤波算法对目标进行尺度预测时采用图像金字塔,在跟踪过程中需要根据多尺度的目标样本训练出跟踪滤波器,导致跟踪过程中存在计算开销大、跟踪速度慢的问题,提出了一种基于密度峰值聚类的全尺度跟踪方法。分别提取搜索区域中目标和背景的特征信息,通过密度峰值聚类方法分别对目标和背景进行聚类;通过单尺度的滤波器对目标位置进行粗预测,并通过交替方向乘子法(ADMM)降低滤波器训练的时间复杂度;对搜索区域中的前景点和背景点进行分类,并根据尺度置信度得到目标的最终位置与尺度。该算法和目前一些主流的跟踪算法在公共数据集通过在OTB2013、OTB2015和DTB70上进行实验,在有效提高跟踪速度的前提下,面对旋转、遮挡等多种复杂情况时的跟踪效果较好、跟踪成功率较高,满足实时性要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号