首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
电子邮件随着Internet的发展给人们带来了方便,随之而来的垃圾邮件却给人们带来无尽的烦恼.本文针对反垃圾邮件技术发展与现状,对目前已应用或正在研究的垃圾邮件过滤技术进行了分析,为项目组改进垃圾邮件过滤方法的下一步工作做前期准备.  相似文献   

2.
基于改进贝叶斯的垃圾邮件过滤系统设计与实现   总被引:7,自引:3,他引:7  
该文设计并实现了一种基于改进贝叶斯的垃圾邮件过滤系统。传统的贝叶斯方法对邮件进行过滤时,将邮件视为一个无序关键词的向量空间,丢掉了词与词之间,句子之间的相互关系。该文则将邮件视为句间有序,句子内部关键词无序但是相关的部分有序的集合。减少传统方法处理时信息的丢失。得到的实验结果比传统方法更好。  相似文献   

3.
电子邮件服务现已成为现代生活通信中不可缺少的一部分,也是Internet服务的一个主要的组成部分。但是垃圾邮件的蔓延给用户带来了严重的损失,如何防范垃圾邮件具有重要的实用意义。本文简单的介绍了几种常用的邮件过滤技术并分析比较了各种技术的优缺点。  相似文献   

4.
电子邮件服务现已成为现代生活通信中不可缺少的一部分,也是Intemet服务的一个主要的组成部分。但是垃圾邮件的蔓延给用户带来了严重的损失.如何防范垃圾邮件具有重要的实用意义。本文简单的介绍了几种常用的邮件过滤技术并分析比较了各种技术的优缺点。  相似文献   

5.
对自学习的过滤技术进行比较和分析,包括已经商品化的方法和目前还处于理论研究阶段的方法,尤其介绍基于机器学习的过滤技术的发展现状,重点研究该领域内的一些新兴过滤技术.在综合比较了一系列的过滤技术的优缺点之后,分析结果表明基于规则的方法和贝叶斯方法是最有潜力的过滤技术.  相似文献   

6.
基于贝叶斯理论的垃圾邮件过滤技术   总被引:12,自引:0,他引:12  
垃圾邮件已成为损耗生产力的问题,反垃圾邮件技术不断出现,基于贝叶斯理论的垃圾邮件过滤技术有其独特的优势,研究针对中文的贝叶斯垃圾邮件过滤技术具有理论和现实的意义。  相似文献   

7.
垃圾邮件过滤技术及发展   总被引:3,自引:0,他引:3  
首先简单介绍垃圾邮件的定义及其来源,其二从多种角度概述垃圾邮件的分类及其研究应用,并较详细介绍行为识别技术,其三指出过滤技术面临的挑战和发展趋势.  相似文献   

8.
随着因特网的不断普及,我国的电子邮件E-mail用户数呈指数级增长,E-mail服务是所有Internet服务中最基本的服务,超过百分之八十的用户使用E-mail服务。E-mail服务为人们的工作、生活、娱乐提供了极大的便利。然而任何事物都有正反两个方面,随着免费电子邮件的普及发展和易于获取,它也  相似文献   

9.
随着电子邮件的普及与应用,垃圾邮件的泛滥也越来越受到人们的关注。而如何进行邮件特征选择,是邮件分类中的重要问题。在介绍词频和倒文档频度的基础上,对几种常用的特征选择算法进行了分析和比较,针对现有特征选择算法过于机械的缺点,将关键字权重引入到邮件分类中,提出了一种基于关键词权重的TF*IDF特征选择改进算法,并进行了实验验证。实验结果表明,采用该算法改进后的贝叶斯过滤器具有更好的过滤效果。  相似文献   

10.
介绍现在普遍采用的几种垃圾邮件过滤方法,对基于内容的过滤方法中的贝叶斯算法和Winnow算法进行详细的介绍.目前研究中文垃圾邮件的各类文献都基于不同的语料库,缺乏算法之间的效果比较分析.分别实现贝叶斯和Winnow的改进算法,并对CCERT的一个公开邮件语料库进行测试.测试结果表明,两种算法都达到较好的过滤效果.  相似文献   

11.
基于SVM和KNN算法的科技文献自动分类研究   总被引:1,自引:0,他引:1  
本文着重对SVM和KNN分类法进行分析,并结合实际的文档集测试了SVM和KNN分类法的性能,给出了实验数据。  相似文献   

12.
文本分类中特征提取方法的比较与分析   总被引:4,自引:0,他引:4  
研究了在文本分类中,各种特征提取方法对分类效果的影响,比较了特征提取方法交叉熵(CE)、信息增益(IG)、互信息(MI)、及X2对文本分类器性能的影响,分析了这几种特征提取方法对SVM和KNN分类器性能的影响.  相似文献   

13.
网页分类算法中,KNN算法的缺陷之一是分类效率较低,分类的效果很大程度上依赖于相似度函数和参敷K的选择.同时,基于支持向量机(SVM)网页分类器的限制在于要求处理的向量是数值型向量,而网页特征向量往往是词条特征向量.利用KNN算法生成训练样本,进而将词务特征向量数值化,再利用支持向量机分类器对测试网页进行分类,构建了一种新的分类器--KNN-SVM分类器.  相似文献   

14.
基于SVM的哈萨克语文本分类   总被引:1,自引:0,他引:1  
介绍了支持向量机(SVM)和k-最近邻法(kNN)分类算法的思想和两种哈萨克语特征提取方法。对SVM、kNN和Bayes算法在哈萨克语文本分类的实验进行了比较。实验结果表明:在处理哈萨克语文本分类问题上,SVM较kNN和Bayes有较好的分类效果。由于哈萨克文单词的语素和构形的特点,若对哈萨克语词缀进行切分,则会降低文本分类的准确率和查全率。  相似文献   

15.
通过实验对SVM、KNN文本分类算法进行了深入探讨。基于KNN和SVM算法,提出了一种SVM.KNN算法。该算法结合KNN和SVM两种分类器,并通过分类预测概率的反馈和修正来提高分类器性能。在CWT100G中文网页分类测试系统中,对SVM.KNN算法的实际效果进行了测试和算法性能验证。  相似文献   

16.
网络信息规模随着互联网与信息技术的发展而不断增大,在这些信息中,各种类型的文本信息占据了相当大的比重。因此,高效、快速地对文本信息进行分类是网络信息处理中一个关键问题。本文分析比较了SVM算法、朴素Bayes算法和KNN算法3种算法,并通过实验证明了这3种算法在中文文本分类中的效果。实验结果表明:SVM算法比KNN算法和朴素Bayes算法更优,SVM算法是一种较好的中文文本分类算法。  相似文献   

17.
以氨基酸含量为特征向量,研究了SVM和KNN预测蛋白质耐热性的准确度。结果表明,基于SVM的分类效果较好,其局部预测率和全局预测率分别为82.4%和83.4%;而基于KNN方法的局部预测率和全局预测率分别为77.6%和79.9%。两种方法的预测率均表明氨基酸含量是影响蛋白质耐热性的主要因素。  相似文献   

18.
KNN文本分类算法研究   总被引:4,自引:0,他引:4  
KNN(K-NearestNeighbour)是向量空间模型中最好的文本分类算法之一。文中介绍了KNN算法的基本思想,归纳了针对KNN算法的不足而提出的改进算法。对KNN文本分类算法的理论研究和实际应用起了指导作用。  相似文献   

19.
从工程设计的角度出发,对常见的升余弦滚降滤波器进行了改良,使之能够满足实际的工程需求。基于《802.11发送接收上采样滤波器的实现》一文所设计的滤波器,对于如何在ASIC/FPGA上实现,如何验证并得出最终结果都有详细的说明。本滤波器已经通过了XilinxVirtex IV和TSMC(台基电)0.18μmCOMS工艺的综合与布局布线,并用于北京市嵌入式重点实验室802.11g无线局域网芯片中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号