首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
刘芬  帅建梅 《计算机工程》2010,36(16):157-160
提出以图像的梯度直方图和颜色直方图作为分类特征,分析最小二乘支持向量机(LS-SVM)算法以及该算法与传统SVM算法的区别,比较传统分类算法与LS-SVM算法的分类准确度,将LS-SVM算法用于图像垃圾邮件过滤。实验结果表明,该方法能提高图像垃圾邮件的检测率。  相似文献   

2.
目前多数敏感图像过滤方法对皮肤裸露较多或类肤色区域较多的图像容易产生误检。为降低对这类图像的误检率,提出一种基于人体关键部位检测的敏感图像过滤方法。该方法提取肤色特征、表征局部对象外观和形状的HOG(Histograms of Orien-ted Gradient)特征、空间分布特征及描述区域灰度分布的Haar-like等特征,利用Adaboost学习算法,训练得到人体关键部位的分类器,通过此分类器实现敏感图像的过滤。实验表明,该方法能够准确地检测关键部位,可以有效地降低敏感图像的误检率。  相似文献   

3.
基于文本区域特征的图像型垃圾邮件过滤算法   总被引:4,自引:0,他引:4  
垃圾邮件图像中通常含有大量文本区域,且这些区域常含有较多区分能力强的特征。提出一种基于图像中文本区域特征的垃圾邮件图像识别算法。首先提取出图像中文本区域的特征,包括:文本区域数量和面积、色饱和度、文字数量和颜色数量,以及图像的一些属性特征如图像面积等;然后利用支持向量机分类算法来识别垃圾邮件图像。实验表明,对于真实的邮件图像集,算法能够识别出98.5%的垃圾邮件图像,且正确率超过98%。  相似文献   

4.
基于颜色与角点特征的图像垃圾邮件识别算法   总被引:1,自引:0,他引:1       下载免费PDF全文
万明成  耿技  程红蓉  王勇 《计算机工程》2009,35(15):209-211
垃圾邮件制造者将垃圾信息嵌入图像中,使基于文本内容的反垃圾邮件系统失效。对垃圾邮件图像的特点深入分析后,提出一种垃圾邮件图像识别算法。垃圾邮件图像多为计算机合成图像,其颜色不如自然图像丰富,且因含有大量文字导致图像中角点角度值分布呈现出一定的规律性。针对此问题选用颜色和角点特征并结合支持向量机分类算法来识别垃圾邮件图像。实验结果表明,该算法对真实垃圾邮件图像的识别精确率超过98%。  相似文献   

5.
基于内容的邮件过滤本质是二值文本分类问题。特征选择在分类之前约简特征空间以减少分类器在计算和存储上的开销,同时过滤部分噪声以提高分类的准确性,是影响邮件过滤准确性和时效性的重要因素。但各特征选择算法在同一评价环境中性能不同,且对分类器和数据集分布特征具有依赖性。结合邮件过滤自身特点,从分类器适应性、数据集依赖性及时间复杂度三个方面评价与分析各特征选择算法在邮件过滤领域的性能。实验结果表明,优势率和文档频数用于邮件过滤时垃圾邮件识别的准确率较高,运算时间较少。  相似文献   

6.
基于CART算法的垃圾邮件过滤模型设计与实现   总被引:1,自引:0,他引:1  
介绍分类与回归树(CART)算法在垃圾邮件过滤中的应用。首先对样本邮件进行文本预处理,并对正常邮件和垃圾邮件训练集进行训练,用CART算法建立单分类器模型,随后又采用Boosting思想组合CART算法建立多分类器模型。对比实验表明,基于CART算法的多分类器模型效果更好。  相似文献   

7.
基于局部特征的图像快速分类算法   总被引:3,自引:2,他引:1  
基于内容的图像快速分类是Web图像实时搜索和过滤的基础。通过分析图像特征分布特点,提出一个基于局部特征的图像快速分类算法。与目前算法相比,该算法仅需对图像的局部区域扫描分析,即可得到其颜色、纹理、形状等特征,并利用Bayesian分类器来实现图像的快速自动分类。相关对比实验证实,该算法能够快速、准确地实现图像分类。  相似文献   

8.
基于小样本学习的垃圾邮件过滤方法   总被引:1,自引:0,他引:1       下载免费PDF全文
针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Na?ve Bayes分类器,以此标注未标记邮件,再使用所有数据训练新的分类器,利用EM算法进行迭代直至收敛。实验结果证明,当给定5个~20个已标记小样本训练邮件时,该方法可有效提高垃圾邮件过滤性能。  相似文献   

9.
为了提高遥感图像的实时分类准确率与效率,提出了一种基于蚁群优化算法与独立特征集的遥感图像集实时分类算法。首先,提取遥感图像的小波域特征与颜色特征,并且组成特征向量;然后,采用蚁群优化算法对特征空间进行优化,独立地选出每个分类的显著特征集,从而降低每个子特征空间的维度;最终,每个分类独立地训练一个极限学习机分类器,从而实现对遥感图像集的分类。基于公开的遥感图像数据集进行了仿真实验,结果显示本算法实现了较高的分类准确率,并且实现了较高的计算效率。  相似文献   

10.
针对卷积神经网络提取特征信息不完整导致图像分类方法分类精度不高等问题,利用深度学习的方法搭建卷积神经网络模型框架,提出一种基于迭代训练和集成学习的图像分类方法。利用数据增强对图像数据集进行预处理操作,在提取图像特征时,采用一种迭代训练卷积神经网络的方式,得到充分有效的图像特征,在训练分类器时,采用机器学习中集成学习的思想。分别在特征提取后训练分类器,根据各分类器贡献的大小,赋予它们不同的权重值,取得比单个分类器更好的性能,提高图像分类的精度。该方法在Stanford Dogs、UEC FOOD-100和CIFAR-100数据集上的实验结果表明了其较好的分类性能。  相似文献   

11.
邓维斌  洪智勇 《计算机应用》2010,30(8):2006-2009
如何将邮件的头信息和内容信息有效结合起来进行垃圾邮件过滤备受研究人员的关注。基于粗糙集具有很好地处理不确定信息的特点,提出了一种基于粗糙集的两阶段邮件过滤方法,首先根据邮件头信息将其分为正常邮件、垃圾邮件和可疑邮件,再根据邮件内容将可疑邮件分为正常和垃圾邮件。通过在中英文邮件集上的测试实验,证明了所提出的邮件过滤方法不仅能提高垃圾邮件过滤的准确率,而且能大幅降低误杀率。  相似文献   

12.
邮件过滤是指从大量的邮件中过滤掉含有无用信息的垃圾邮件,以帮助用户得到所需的有用邮件。本文将介绍一个基于向量空间模型的OUTLOOK邮件过滤器的设计与实现,它包含了邮件过滤和训练两个子系统,其过滤方法还对传统的向量空间模型法做了改进,使之更适合于垃圾邮件过滤。  相似文献   

13.
黄海凌  刘列根  张宇 《计算机工程》2008,34(15):231-233
文档图像处理技术是实现对网络上以“图片化”形式发送的垃圾邮件进行检测和过滤的有效手段。该文对彩色文档图像的版面进行分析,目的是分割出图像中的特定目标,便于分析并检测出文档图像中是否含有特别字符信息,从而使得网络垃圾邮件过滤系统可以根据这些信息判断是否过滤该邮件。实验结果表明,上述方法可以在不同颜色深度和不同几何结构的彩色文档图像中进行有效的检测,具有较好的实用性和应用价值。  相似文献   

14.
郭鑫  陈克非 《计算机工程》2008,34(15):146-147,
文档图像处理技术是实现对网络上以"图片化"形式发送的垃圾邮件进行检测和过滤的有效手段.该文对彩色文档图像的版面进行分析,目的是分割出图像中的特定目标,便于分析并检测出文档图像中是否含有特别字符信息,从而使得网络垃圾邮件过滤系统可以根据这些信息判断是否过滤该邮件.实验结果表明,上述方法可以在不同颜色深度和不同几何结构的彩色文档图像中进行有效的检测,具有较好的实用性和应用价值.  相似文献   

15.
垃圾邮件的泛滥成灾给人们的正常生活带来了很大的不便和危害。该文设计并实现了基于NP的垃圾邮件分析系统,具有邮件抓取、还原和类别识别功能,能够有效识别垃圾邮件。实验结果表明,该系统对于垃圾邮件的追踪具有良好的实用价值。  相似文献   

16.
虽然目前垃圾邮件过滤或检测的研究比较多,但是它们大多数是基于邮件客户端。文章提出了一种基于后缀树的骨干网络垃圾邮件检测方法,它采用后缀树文本表示方法,通过不定长统计方法判定邮件是否相似,然后利用邮件重复出现的次数判定是否为垃圾邮件。该方法不需要任何训练,直接对接收的邮件进行分类统计;对于长度为的邮件,算法的时间复杂度和空间复杂度均为;另外,该方法独立于任何语种。  相似文献   

17.
基于双隶属度模糊支持向量机的邮件过滤   总被引:2,自引:0,他引:2       下载免费PDF全文
针对邮件所含信息的模糊性和合法邮件与垃圾邮件错分代价的不对称性提出了基于双隶属度模糊支持向量机的邮件过滤方法,通过对每个样本赋予不同的双隶属度,得到最优分类器,提高了邮件过滤的正确率。经仿真实验证明,该方法能够有效降低将合法邮件误判为垃圾邮件,而且有很高的正确率等特点。  相似文献   

18.
电子邮件广泛应用于人们的工作生活中。然而,充斥着虚假信息、恶意软件和营销广告等内容的垃圾邮件也以电子邮件为载体进行传播。这不仅给人们带来不便,而且也占用和耗费大量的网络资源,甚至严重地威胁信息安全。因此,有效地识别、过滤垃圾邮件是一项重要的工作。目前,垃圾邮件过滤方法主要包括基于邮件来源的识别和基于内容的识别,但大部分方法效果不佳且效率不高,并且需要耗费大量的人力标注特征,也跟不上垃圾邮件内容和形式等的改变。近年来,有研究人员将深度强化学习用在自然语言处理上并取得了重大的成果,鉴于此,本文提出基于深度Q网络的垃圾邮件文本分类方法。该方法在对邮件文本进行预处理、分词以及用Word2vec模型得到词向量的基础上用深度Q网络对垃圾邮件进行过滤,充分利用Word2vec中的CBOW模型得到邮件文本中的每个分词对应的词向量,直接用深度Q网络对得到的词向量集进行处理,无需提取邮件的特征,避免了由于特征提取的偏差带来的负面影响,提高了垃圾邮件过滤的效率和精确率。实验结果验证了本文方法的有效性。  相似文献   

19.
分析邮件特征对邮件分类的影响,提出了双层分类方法并用于邮件服务智能代理.它包括邮件长度分类、邮件采集与预处理、文本分词、特征选取和邮件分类器等功能模块.此代理不仅可使邮件服务器具有自动过滤垃圾邮件的能力,也可以用于电子政务和电子商务,对邮件自动分类和转发.该双层分类方法首先对邮件按长度进行分类,然后根据邮件的不同长度类分别使用不同的贝叶斯分类器,从而实现垃圾邮件的过滤.实验表明它有效地提高了邮件分类的效率.  相似文献   

20.
为了提高垃圾邮件过滤系统的对邮件过滤的准确性和返回率,论文改进了传统的贝叶斯定理。提出一种改进的垃圾邮件过滤方法,该方法使用基于单词提取特征值和使用特征向量来描述频率。模型降低了垃圾邮件的错误率,总体上提高了系统的过滤性能。与传统贝叶斯公式的假设不同,系统为垃圾邮件样本的每个特征值分配不同的权值,降低了的垃圾邮件判断误差。实验结果表明,论文提出的垃圾邮件过滤方法能够显着提高准确性和返回率,系统性能得到了较大改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号