首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 343 毫秒
1.
序列数据一类重要的数据类型,在文本、Web访问日志文件、生物数据库等应用中普遍存在,对其进行相似性查询是一种获取有用信息的重要手段.在大型序列数据库中进行高效相似性查询的关键因素之一就是查询算法的过滤能力,即设计能快速过滤与查询序列不相关序列集的过滤器十分重要.提出了结合序列距离的度量性质和序列自身特征的多重过滤算法SSQ_MF,SSQ_MF使用了长度过滤器、前缀过滤器和基于参考集的过滤器,使得算法过滤能力较基于单一过滤器算法进一步增强.此外,设计了有关数据结构对查询数据库的一些统计信息进行了预计算和保存,有效估计了各过滤器的过滤集大小,并构建了一个由过滤集大小确定的最优过滤顺序模型,使得算法的过滤代价最低.实验结果表明,算法SSQ_MF的查询性能优于单一过滤器算法和随机过滤顺序的多过滤器算法.  相似文献   

2.
3.
在数据库系统中连接操作是一个开销相当大的操作,因此人们对连接算法进行了大量的研究工作,包括连接过滤器技术的研究。本文提出了一种新的连接过滤器技术,即签名过滤器,以进一步提高各种连接算法的性能。我们在一个面向对象的数据库系统中进行了比较系统的实验,分析了签名过滤器的过滤能力与签名连接算法的性能,同时也讨论了签名过滤器与位向量过滤器之间的关系。  相似文献   

4.
基于MapReduce的贝叶斯垃圾邮件过滤机制   总被引:1,自引:0,他引:1  
陶永才  薛正元  石磊 《计算机应用》2011,31(9):2412-2416
贝叶斯邮件过滤器具有较强的分类能力和较高的准确性,但前期的邮件集训练与学习耗用大量系统资源和网络资源,影响系统效率。提出一种基于MapReduce技术的贝叶斯垃圾邮件过滤机制,一方面对传统贝叶斯过滤技术进行改进,另一方面利用MapReduce模型的海量数据处理优势优化邮件集训练与学习。实验表明,较之目前流行的传统贝叶斯算法、K最近邻(KNN)算法和支持向量机(SVM)算法,基于MapReduce的贝叶斯垃圾邮件过滤机制在召回率、查准率和精确率方面保持了较好的表现,同时降低了邮件学习和分类成本,提高了系统执行效率。  相似文献   

5.
在垃圾邮件过滤中,针对过滤器对合法邮件的误判问题,提出一种改进的垃圾邮件过滤算法。该算法对信息增益的条件熵估计方法作了改进,结合最小风险贝叶斯决策方法,在英文语料库上进行实验,并采用召回率和正确率对算法进行评价分析。实验结果表明,改进后的方法可提高过滤器对合法邮件的识别能力,降低对合法邮件的误判,减少用户的损失。  相似文献   

6.
邮件过滤算法的比较   总被引:1,自引:0,他引:1  
探讨了邮件过滤器的体系,介绍了6种常用的过滤算法.在4个公用的数据集上,利用3个评价指标对这6种算法进行了全面的比较.实验的主要结论有:集成过滤器的方法有利于提高过滤效果;与其它两个数据集相比,PU1和Ling-spam数据集用于评价过滤器时会得出相对乐观的结果;NB和k-NN的表现不稳定,对数据集的敏感程度较高.对于邮件过滤研究者了解、改进已有算法,提出新的算法有一定的参考价值.  相似文献   

7.
基于内容的协同过滤器利用用户关于误判和漏判信息的反馈,对电子邮件进行过滤,可以提高过滤器跟踪垃圾邮件中概念漂移的能力,但这类方法都对集中式的垃圾邮件过滤做出了隐含假设.为了解决集中式协同邮件过滤的问题,提出了一种基于P2P网络的个性化协同垃圾邮件过滤模型,描述了其系统结构和基于签名的系统设计与实现方法.实现了一个原型系统,收集使用其作为垃圾邮件过滤器的用户的数据进行分析.实验结果分析表明,这种个性化协同垃圾邮件过滤是准确和有效的.  相似文献   

8.
运用TEIRESIAS算法从邮件中提取模式作为表示邮件的属性,在此基础上实现了一个贝叶斯垃圾邮件过滤实验系统。通过实验,比较分析了该过滤器的性能,并讨论了属性集大小、属性最少出现次数对基于模式的贝叶斯垃圾邮件过滤系统的影响。  相似文献   

9.
RFID技术作为物联网领域的关键技术,具有广阔的应用前景。然而RFID设备在读取标签信息时会产生大量冗余数据。因此,RFID数据冗余处理的研究对于减少RFID中间件系统负荷、快速检测出入标签有着重要的意义。之前针对RFID数据冗余过滤的研究往往是单维度、静态场景的简单过滤,无法实现复杂场景下标签的出入检测。因此,本文提出一种名为时间距离布隆过滤器(TDBF)的算法,该算法从时间和空间两个维度进行冗余过滤。与常用的时间布隆过滤器相比,该算法兼顾了RFID标签的读取时间和读取距离,极大的降低了数据的冗余问题。在保证漏读率较低的情况下,极大的降低了数据的误读率。同时该算法支持动态场景中移动标签的冗余过滤,能够较好的满足出入监控需求。  相似文献   

10.
不法分子为了逃避过滤,将不良信息中的敏感关键词进行变形。为了识别这些变形的关键词,提出了一种柔性过滤算法。在此基础上,利用浏览器帮助对象(BHO),构建了一个中文网页内容柔性过滤器,用于实时过滤由变形关键词生成的不良网页。该过滤器改善了传统过滤器不能过滤变形关键词的现状,是对传统的基于关键词过滤方法的补充。  相似文献   

11.
电子邮件过滤新方法的研究与实现   总被引:1,自引:0,他引:1  
谭汉松  杨盛 《微机发展》2005,15(5):152-154
电子邮件给人们带来极大便利,但垃圾邮件的日益泛滥,也给人们带来了极大的不便和危害。传统的邮件过滤方法的过滤精度较低,不能很好满足需要。文中提出了一种基于向量空间模型的电子邮件过滤系统,并对向量空间模型进行了改进:采用字作为文本向量的特征表示,并且在字频向量的特征提取时采用了一种新的特征提取函数,从而提高了邮件分类的精度,达到了较好的过滤垃圾邮件的目的。  相似文献   

12.
一个新型的Web邮件系统设计   总被引:2,自引:0,他引:2  
陆建德 《计算机工程》2002,28(6):186-189
详细讨论了基于Web的电子邮件收发与过滤系统WMFS的设计思想和开发方法,对基于Web的电子邮件收发系统设计、邮件的收发与存储管理、邮件过滤器设计等具体实现进行了讨论。  相似文献   

13.
随着现代通信技术的发展,电子邮件成为最快捷、经济的通信手段。但是许多无用、有害的信息随之而来,需要对获得的邮件进行自动的筛选。在邮件的筛选中,对原始邮件的预处理过程(即邮件内容的提取)是一切邮件筛选技术的基础。本文在介绍RFC822、MIME规范的基础上,开发出了一个实用的邮件预处理系统,该系统在信体和信头的边界确定、附件处理、信体内容提取等方面进行了一定的改进,试验证明改进的方法在减少乱码、正确还原邮件以及降低处理维数等方面效果明显。  相似文献   

14.
介绍了一种垃圾邮件过滤系统的设计方案,该系统应用于邮件服务器的前端,不依赖于所采用的邮件服务器系统。该系统按其功能可以划分为邮件采集模块、邮件过滤模块、数据库和管理维护模块等四个部分。重点介绍了采用基于贝叶斯方法的智能启发式过滤技术的邮件过滤模块设计。最后给出了系统的测试情况。  相似文献   

15.
基于Linux的透明邮件过滤系统的实现   总被引:1,自引:0,他引:1  
电子邮件过滤是网络信息安全研究的热点。垃圾邮件浪费网络资源,干扰个人通讯,威胁着网络安全,甚至存在着盗用资源和散布谣言等问题,因此引起了全社会的广泛关注。在分析了现有网络安全产品不足的基础上,提出了基于Linux的透明邮件过滤系统的设计与实现方案。  相似文献   

16.
基于内容分析的电子邮件过滤模型的设计   总被引:4,自引:0,他引:4  
电子邮件在给人们带来很多方便的同时,也产生了一个新的问题,即大量垃圾邮件的出现。邮件过滤就是从大量邮件中过滤出垃圾邮件。文章介绍了基于内容分析的邮件过滤,讨论了邮件分类的一种方法,以及使用该方法实现基于内容分析的电子邮件过滤的模型。  相似文献   

17.
电子邮件(E-mail)是Intemet应用最广的服务之一.针对邮件的安全问题,在分析电子邮件工作原理的基础上,提出了内容相关过滤方法并设计了一个具有过滤功能的电子邮件客户端系统.  相似文献   

18.
基于神经网络的电子邮件分类与过滤   总被引:2,自引:0,他引:2  
任劼  项婧 《计算机工程与设计》2006,27(6):1021-1024,1064
现在电子邮件的应用非常广泛,已经成为人们生活中一种重要的通讯手段,但各种各样的垃圾邮件也是令我们十分困扰的问题,给出了一种电子邮件的分类过滤方法。电子邮件作为一种半结构化的文档,电子邮件信息包含了固定的语法部分和一定长度的可变文本部分,同时处理这两部分以得到更高的准确度。首先对邮件进行文本处理,得到特征向量;然后使用基于神经网络的方法对邮件进行分类过滤得到邮件分类器;最后通过实验验证分类器的有效性。  相似文献   

19.
高性能邮件过滤服务结构模型设计与实现   总被引:1,自引:0,他引:1  
分析了MTA方式邮件过滤系统的业务流量和网络服务特点,以排队论为基础,建立了一个高性能邮件过滤服务模型,用于对邮件过滤系统的服务能力进行理论预测,并结合一个具体的应用场景,提供一个实例,其理论分析结果与实际情况相符,验证了该模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号