首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 364 毫秒
1.
入侵检测数据流具有偏斜分布以及概念漂移的特点,其样本无法准确反映整个空间的数据分布,分类器容易被大类淹没而忽略小类,使得检测正确率不高,对此,文中提出了一种单分类器集成的入侵检测方法,该方法在使用k-means聚类算法调整数据分布的基础上,用区间估计结合AUC的值检查概念漂移并更新分类器.实验结果表明,在处理偏斜数据流上优于均值、乘法规则、最大值三种分类处理方法,并具有较高的入侵检测率.  相似文献   

2.
基于模糊概念格的Web搜索结果聚类算法   总被引:4,自引:1,他引:3  
提出了一种模糊形式概念分析方法,给出了在对象和属性的模糊二元关系上生成模糊概念格的过程.提出了一种在格的拓扑序列上进行概念聚类的快速算法,并且定义了概念聚类间基于偏序的层次关系.该方法利用格理论解决了概念聚类中概念间的多重继承关系,应用在Web搜索结果聚类上,实验结果表明算法在聚类质量和检索性能上都有改进和提高.  相似文献   

3.
基于贝叶斯分类的邮件过滤方法及模型研究   总被引:5,自引:1,他引:5  
垃圾邮件日益泛滥,给用户带来了极大的不便和危害.并对网络安全构成威胁.传统邮件过滤方法单一,过滤精度不高,已不能很好地满足需求.结合规则过滤技术,分析了基于文本内容的贝叶斯分类器实现的关键技术与方法,并给出核心过滤算法在邮件分类中的实现具体方法及过程,进而完成垃圾邮件的判别.为减少邮件的误判对用户造成的损害及垃圾邮件漏判造成的影响,提出相应的改进措施,使用最小风险贝叶斯决策减小误判率,对分类系统经训练部分进行自适应调整,最后给出基于规则与内容的双重防范机制的邮件过滤模型及基于该框架的邮件判别流程.  相似文献   

4.
提出了一种基于相对熵和子空间二次过滤的CLIQUE改进算法。该算法根据数据的分布情况对每一维采用自适应的网格划分方法,减少了全空间中网格单元的数量,降低了算法的时间复杂度。算法采用了基于维关联度的子空间二次过滤策略,提高了聚类结果的准确性。实验使用仿真数据表明,该算法在精度,时间复杂性等方面的表现优越。  相似文献   

5.
为了提高电子邮件中垃圾邮件的过滤准确率和效率,以朴素贝叶斯算法和K最近邻(KNN:K-Nearest Neighbors)算法为基础,对传统垃圾邮件过滤算法进行改进,给出邮件的合法属性和非法属性的概念,并提出一种新的分类算法——基于邮件合法属性和非法属性的分类算法(SEASF:Simple and Efficient Algorithm to Spam Filter based on legitimate attribute and nonlicet attribute)。SEASF计算复杂度较低,可适用于大规模场合及邮件的在线过滤。将SEASF算法应用于垃圾邮件过滤的结果表明,该算法可大幅度提高分类精度,分类速度也令人满意。  相似文献   

6.
为实现对电子邮件中垃圾邮件的过滤,提出一种新的邮件过滤算法和邮件过滤Agent的设计方法。Agent通过算法学习用户接收邮件的信息及用户对邮件的处理习惯,据此最终确定邮件是否为垃圾邮件或病毒邮件,从而过滤掉非正常邮件。实验测试表明,Agent对邮件过滤的正确率可达85%,为现有电子邮件系统提供了一种改进方法。  相似文献   

7.
目的设计基于DTW的高效过滤算法,提高时间序列数据流的过滤查询的效率.方法提出基于DTW的双边界的概念,并在此基础上定义新的更紧密的基于DTW的下界距离.结果实验证明基于DTW双边界的过滤算法在不发生错误丢失的情况下改进了算法的效率.对于模式间差异较大的情况,算法性能更好.结论基于DTW的双边界算法可以有效地过滤时间序列数据流.  相似文献   

8.
贝叶斯网络在过滤垃圾邮件算法中的应用研究   总被引:2,自引:0,他引:2  
为在用户数据流中删除垃圾邮件,研究了具有自我学习能力的自适应邮件过滤系统.在对正常和垃圾2类邮件误分类成本分析的基础上,利用概率性的学习方法创建满足过滤任务需要的过滤器,且讨论使用邮件域名特征变量进行特定邮件过滤并设计了过滤器,最后对实际邮件组进行操作,验证了算法的可靠性.  相似文献   

9.
在已知数据挖掘、聚类、数据聚类、非冗余等相关概念和基本聚类算法背景下,给出了非冗余聚类的总体概念框架和过程.引出了基于条件集非冗余聚类的改进聚类算法——CondEns算法,阐述了利用CondEns算法实现数集聚类的过程.最后在实验的基础上比较CondEns算法和没改进域聚类算法中的一种:CCIB算法,随着正交性减弱研究非冗余数集聚类的鲁棒性,发现了算法CondEns表现得比CCIB更好.  相似文献   

10.
基于种群分类解决遗传算法的“早熟”与“漂移”问题   总被引:4,自引:0,他引:4  
为了有效解决遗传算法在实际应用过程中经常面临的早熟收敛和遗传漂移问题,分析了导致早熟收敛和遗传漂移这两种现象出现的原因,针对其主要原因提出了基于模糊聚类的种群分类改进的遗传算法,避免近亲繁殖导致早熟,并将模糊聚类的结果与各种遗传操作有效结合,提高了算法向最优解收敛的准确性和稳定性。最后,仿真结果显示新的改进算法比标准遗传算法更有效。  相似文献   

11.
随着对垃圾邮件问题的普遍关注,针对目前邮件过滤方法中存在着的语义缺失现象和处理群发型垃圾邮件低效问题,提出一种基于潜在语义分析(LSA)和信息-摘要算法5(MD5)的垃圾邮件过滤模型。利用潜在语义分析标注垃圾邮件中潜在特征词,从而在过滤技术中引入语义分析;利用MD5在LSA分析基础上,对群发型垃圾邮件生成"邮件指纹",解决过滤技术在处理群发型垃圾邮件中低效的问题。结合该模型设计了一个垃圾邮件过滤系统。采用自选数据集对文中设计的系统进行测试评估,经与Naïve Bayes算法过滤器进行比较,证明该方法在垃圾邮件过滤上优于Naïve Bayes方法,实验结果达到了预期的效果,验证了该方法的可行性、优越性。  相似文献   

12.
信息粒度原理是一种从多个角度来精确描述对象的物理学方法。本文将信息粒度的原理应用到垃圾邮件的过滤中,提出了一种基于信息粒度原理的垃圾邮件过滤方法。通过对原始样本空间更精细的划分来实现对邮件类别的更准确描述。本文在Ling-Spam语料库上进行了试验,结果表明,新方法具有较高的分类精度和良好的处理速度。  相似文献   

13.
决策树在垃圾邮件过滤中的应用   总被引:1,自引:0,他引:1  
介绍了垃圾邮件过滤技术,对决策树算法的基本思想进行阐述,分析比较其优点和不足,给出了基于ID5R算法的垃圾邮件过滤模型.  相似文献   

14.
基于贝叶斯过滤算法的反垃圾邮件策略   总被引:4,自引:0,他引:4  
结合传统贝叶斯算法的数学定理.给出了朴素贝叶斯过滤算法以及该算法在反垃圾邮件中的六个处理步骤,算法通过渐进学习的方式分别建立三个哈希表,并预置相应的阀值来判定收到的邮件是否为垃圾邮件.以实例方式说明了此算法为基础的反垃圾邮件策略,最后指出了朴素贝叶斯算法存在的问题及可能改进的方向,对防范和处理垃圾邮件提供理论依据和实践参考.  相似文献   

15.
单一的垃圾邮件过滤技术已经不能有效阻止不断出现的新型垃圾邮件,基于多Agent技术结合现有垃圾邮件过滤技术建立一个多技术整合分层过滤的垃圾邮件过滤系统.该系统在服务器端主要对一些具有反动、色情和病毒特征的邮件进行强制过滤,在客户端可以根据用户的兴趣选择进行个性化过滤.  相似文献   

16.
Lucene的最小风险概率加权朴素贝叶斯算法   总被引:1,自引:0,他引:1  
为了提高垃圾邮件过滤的准确性,在分析垃圾邮件数据的基础上,对比信息检索与信息过滤之间的关系,将信息检索框架Lucene应用到垃圾邮件过滤系统中,提出最小风险概率加权的朴素贝叶斯算法,与最小风险法结合,有效地减少贝叶斯方法的独立性约束.实验验证了加权朴素贝叶斯算法的有效性.  相似文献   

17.
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。  相似文献   

18.
一种混合的垃圾邮件过滤算法研究   总被引:3,自引:0,他引:3  
贝叶斯邮件过滤器具有较强的分类能力,极高的准确率,在内容过滤领域占据主导地位。人工免疫系统具备强大的自学习、自适应,鲁棒性等能力,已发展成为计算智能研究的一个崭新的分支。该文在分析贝叶斯的原理和人工免疫的仿生机理的基础上,将贝叶斯与人工免疫相结合,设计和实现了一种基于贝叶斯和人工免疫的混合垃圾邮件过滤算法,并利用现有的垃圾邮件语料库得到预期的实验结果。  相似文献   

19.
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。  相似文献   

20.
垃圾邮件不仅浪费大量的网络资源,并且给用户带来很大的不便,如何有效地防范垃圾邮件,已成为网络信息安全领域的主要课题之一。本文通过对传统垃圾邮件过滤技术的分析,提出了一种基于指纹的定量过滤方法。对白名单和黑名单过滤、定时过滤、基于指纹的定量过滤和贝叶斯过滤技术进行了整合,建立了一种客户端垃圾邮件过滤系统的模型,该系统具有较高的过滤准确性,并且能适应用户的个性化需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号