首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
电子邮件给人们带来极大便利,但垃圾邮件的日益泛滥,也给人们带来了极大的不便和危害.传统的邮件过滤方法的过滤精度较低,不能很好满足需要.文中提出了一种基于向量空间模型的电子邮件过滤系统,并对向量空间模型进行了改进:采用字作为文本向量的特征表示,并且在字频向量的特征提取时采用了一种新的特征提取函数,从而提高了邮件分类的精度,达到了较好的过滤垃圾邮件的目的.  相似文献   

2.
谭汉松  杨盛 《微型电脑应用》2005,21(4):15-16,48
电子邮件给人们带来极大便利的同时,垃圾邮件的日益泛滥,也给人们带来了极大的不便和危害。本文提出了一种基于向量空间模型的电子过滤系统,并对向量空间模型进行了改进,达到了较好的过滤垃及邮件的目的。  相似文献   

3.
王强  贾银山 《微处理机》2010,31(3):43-45,49
电子邮件已经成为了人们日常生活中不可缺少的通讯方式,然而垃圾邮件的泛滥给计算机网络安全带来威胁并给人们正常的信息交流带来了极大的不便,因此反垃圾邮件日益重要。支持向量机是在统计学习理论的基础上发展起来的新型机器学习算法,在解决小样本学习、非线性及高维模式识别问题中表现较好。因此采用支持向量机对垃圾邮件进行过滤,首先将文本类型的邮件进行预处理,提取合适的邮件特征,把邮件转化成向量空间模型,最后用支持向量机方法进行分类。实验表明支持向量机提高了过滤性能。  相似文献   

4.
研究垃圾邮件过滤准确率问题,电子邮件是一种高维、复杂的特殊文本,单一支持向量机、K近邻等传统模型均难以识别垃圾邮件,导致过滤正确率低.为了提高了垃圾邮件过滤正确率,提出一种K近邻和支持向量机相融合的垃圾邮件过滤模型(SVM-KNN).首先将邮件特征向量输入到支持向量机学习,找到支持向量集,然后计算待识别邮件与最优超平面间的距离,距离大于阈值,便采用支持向量机识别邮件类型,否则用K近邻识别邮件类型.仿真结果表明,SVM-KNN很好地解决单一模型存在的难题,提高了垃圾邮件过滤正确率,是一种有效的电子邮件管理的手段.  相似文献   

5.
随着电子邮件的广泛应用,泛滥成灾的垃圾邮件对人们的生活和网络安全带来了严重的威胁,反垃圾邮件问题已成为全球性的具有现实意义的问题.本文提出了一种基于动态特征词典的SVM中文邮件过滤方法,通过动态构造特征词典以及选择合适的支持向量机(Suppo~Vector Machine,SVM)核参数,有效地提高了垃圾邮件的过滤精度,实验结果超过了网易免费邮所公布的过滤指标.  相似文献   

6.
基于内容分析的电子邮件过滤模型的设计   总被引:4,自引:0,他引:4  
电子邮件在给人们带来很多方便的同时,也产生了一个新的问题,即大量垃圾邮件的出现。邮件过滤就是从大量邮件中过滤出垃圾邮件。文章介绍了基于内容分析的邮件过滤,讨论了邮件分类的一种方法,以及使用该方法实现基于内容分析的电子邮件过滤的模型。  相似文献   

7.
随时信息技术的不断发展,电子邮件已成为人们普遍的交流工具之一,但随之而来的垃圾邮件却严重影响的这一日常交流方式。为了更好的净化电子邮件的收发环境,反垃圾邮件技术的提高迫在眉睫。目前最为常用的技术之一是基于机器学习的垃圾邮件技术。该技术具有语言无关性,笔者通过对中文垃圾邮件过滤技术进行研究,通过分析中文垃圾邮件的特点,特征提取方法和多种过滤模型,采用4元文法提取方法,在线松弛支持向量机模型(ROSVM)的过滤效果较好。  相似文献   

8.
电子邮件广泛应用于人们的工作生活中。然而,充斥着虚假信息、恶意软件和营销广告等内容的垃圾邮件也以电子邮件为载体进行传播。这不仅给人们带来不便,而且也占用和耗费大量的网络资源,甚至严重地威胁信息安全。因此,有效地识别、过滤垃圾邮件是一项重要的工作。目前,垃圾邮件过滤方法主要包括基于邮件来源的识别和基于内容的识别,但大部分方法效果不佳且效率不高,并且需要耗费大量的人力标注特征,也跟不上垃圾邮件内容和形式等的改变。近年来,有研究人员将深度强化学习用在自然语言处理上并取得了重大的成果,鉴于此,本文提出基于深度Q网络的垃圾邮件文本分类方法。该方法在对邮件文本进行预处理、分词以及用Word2vec模型得到词向量的基础上用深度Q网络对垃圾邮件进行过滤,充分利用Word2vec中的CBOW模型得到邮件文本中的每个分词对应的词向量,直接用深度Q网络对得到的词向量集进行处理,无需提取邮件的特征,避免了由于特征提取的偏差带来的负面影响,提高了垃圾邮件过滤的效率和精确率。实验结果验证了本文方法的有效性。  相似文献   

9.
邮件过滤是指从大量的邮件中过滤掉含有无用信息的垃圾邮件,以帮助用户得到所需的有用邮件。本文将介绍一个基于向量空间模型的OUTLOOK邮件过滤器的设计与实现,它包含了邮件过滤和训练两个子系统,其过滤方法还对传统的向量空间模型法做了改进,使之更适合于垃圾邮件过滤。  相似文献   

10.
基于支持向量机的邮件过滤   总被引:1,自引:0,他引:1  
随着万维网的兴起和电子邮件的快速发展,大量的垃圾电子邮件也随之在互联网上泛滥.电子邮件过滤就是要在大量邮件中过滤出垃圾邮件,帮助用户找到所需的邮件。本文讨论了基于机器学习方法实现垃圾邮件过滤的原理,提出一种改进的基于支持向量机的邮件过滤技术,该方法使用互信息度函数,结合Z-测试进行特征选择,使用SVM(支持向量机)构造分类超平面来进行文本分类。实验表明,提高了中文邮件过滤的准确性。  相似文献   

11.
基于语义空间的支持向量机的文本过滤   总被引:2,自引:0,他引:2  
传统的基于支持向量机的文本过滤,用向量空间模型来表示文本和用户模板,向量空间模型假设特征项之间是线性无关的,该假设引入了许多因具体用词变化不定而带来的词汇噪音信息,影响了基于支持向量机的文本过滤的过滤性能。提出基于语义空间的支持向量机的文本过滤,用语义来表示文本和用户模板。该方法主要通过奇异值分解提取文本的潜在语义空间,在语义空间上训练支持向量机得到用户模板和过滤阈值,文本流上的文本映射到语义空间上,在语义空间上计算用户模板和新文本的相似度。实验表明:该方法的过滤性能可以达到 98. 67%。  相似文献   

12.
龚伟  李柳柏 《微机发展》2007,17(3):163-165
以智能决策支持系统结构为基础,提出了一种新的电子邮件过滤模型,并对中文垃圾邮件过滤中的中文分词及垃圾邮件特征知识库的更新等关键问题进行了探讨。开发了“智能邮件过滤系统(IEFS)”,使垃圾邮件误判率得到了一定程度的控制,有效防止了垃圾邮件的泛滥。  相似文献   

13.
谭建龙  张吉  郭莉 《计算机工程》2007,33(9):100-102
采用通用后缀树模型(GSTM),利用邮件内容的上下文信息,进行每个文本位置的不定长多元统计,从而获得被测邮件与不同训练集的相似程度,确定邮件所属的类别。理论分析和实验表明,在相同语料上,该方法的精确度和召回率均达到或超过了基于向量空间模型的邮件过滤方法;对于长度为N的邮件,过滤时间为O(N);长度为N的新邮件加入训练集,训练时间为O(N),满足了训练集的动态增长;该方法不需进行分词处理,完全独立于语种,适用于多语种邮件同时存在的情况。  相似文献   

14.
基于神经网络的电子邮件分类与过滤   总被引:2,自引:0,他引:2  
任劼  项婧 《计算机工程与设计》2006,27(6):1021-1024,1064
现在电子邮件的应用非常广泛,已经成为人们生活中一种重要的通讯手段,但各种各样的垃圾邮件也是令我们十分困扰的问题,给出了一种电子邮件的分类过滤方法。电子邮件作为一种半结构化的文档,电子邮件信息包含了固定的语法部分和一定长度的可变文本部分,同时处理这两部分以得到更高的准确度。首先对邮件进行文本处理,得到特征向量;然后使用基于神经网络的方法对邮件进行分类过滤得到邮件分类器;最后通过实验验证分类器的有效性。  相似文献   

15.
基于向量空间模型的实时内容过滤   总被引:2,自引:0,他引:2  
何静  刘海燕 《计算机工程》2004,30(15):26-27,85
内容过滤是网络安全领域的一个新课题,目前对内容过滤技术的研究集中于对关键词的检查和分析,过滤精度较低。该文建立了一个基于向量空间模型的内容过滤模型,它提高了过滤精度,并且能在过滤精度与实时性之间较好地达成平衡。  相似文献   

16.
用户画像技术可以给企业带来巨大的商业价值。针对用户的历史查询词,利用词向量可以得到查询词在语义层次上的表达,但词向量模型对于同一个单词生成的词向量是相同的,使得该模型无法很好的处理一词多义的情况。因此,使用LDA主题模型为每个查询词分配主题,使查询词和其主题共同放入神经网络模型中学习得到其主题词向量,最后采用随机森林分类算法对用户基本属性进行分类构建用户画像。实验结果表明,该模型的分类精度要高于词向量模型。  相似文献   

17.
教学反思是教师专业能力发展的重要途径,对反思内容进行自动评估是网络环境下教学反思系统亟待解决的关键问题。对网络环境下提交的反思文本进行中文分词、停用词过滤等预处理,采用向量空间模型构建反思文本向量,基于余弦理论计算反思文本与语料库文本的相似度。根据最大相似度语料文本的等级及系统预设阈值,实现反思内容的自动评估。实验结果表明,自动评估结果和专家认定的评估结果相比,正确率达到90%以上,基本实现了反思内容的自动评估。  相似文献   

18.
基于语义的信息检索模型   总被引:3,自引:0,他引:3       下载免费PDF全文
由于查询与文档中词语的不匹配现象导致一些相关的文档不能被成功地检索出来,在信息检索的研究与实现中,这是影响检索效果的一个很关键的问题。把概念图和知网结合起来,提出对应的相关反馈算法,重新计算词项权重,利用向量空间模型和语义相似度进行语义检索,并给出了语义检索模型。实验结果显示该方法取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号