首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 195 毫秒
1.
针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法.为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法.在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围.从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.  相似文献   

2.
基于贝叶斯算法的垃圾邮件过滤技术   总被引:8,自引:0,他引:8  
对基于朴素贝叶斯算法的垃圾邮件过滤技术进行了研究分析和实验验证.介绍了向量空间模型(VSM)方法以及特征向量抽取方法,推导和研究了引入“特征之间互相独立”假设的朴素贝叶斯分类算法.采用K次交叉验证的方法,以收集的一些邮件为语料,应用朴素贝叶斯分类算法,通过训练集计算得到类别的先验概率和特征项的类条件概率,并以此为基础对测试集中的邮件进行归属判断,以正确率和召回率为指标给出了实验结果.  相似文献   

3.
为完成在邮件服务器内部过滤垃圾邮件的任务,参考经典贝叶斯模型,研究有自动调节能力的模型算法。以实验室样本邮件为目标,定义过滤器算法模型,并对系统环境变量设置进行讨论[5],最后对测试邮件文件进行加工,证明了模型设计的合理性。  相似文献   

4.
基于贝叶斯过滤算法的反垃圾邮件策略   总被引:4,自引:0,他引:4  
结合传统贝叶斯算法的数学定理.给出了朴素贝叶斯过滤算法以及该算法在反垃圾邮件中的六个处理步骤,算法通过渐进学习的方式分别建立三个哈希表,并预置相应的阀值来判定收到的邮件是否为垃圾邮件.以实例方式说明了此算法为基础的反垃圾邮件策略,最后指出了朴素贝叶斯算法存在的问题及可能改进的方向,对防范和处理垃圾邮件提供理论依据和实践参考.  相似文献   

5.
基于朴素贝叶斯算法的垃圾邮件过滤器是目前比较高效、经济的垃圾邮件过滤技术之一,它已经广泛应用到垃圾邮件过滤领域。文章在对朴素贝叶斯过滤器分析的基础上,针对朴素贝叶斯算法的缺陷结合损失最小化的思想,并根据垃圾邮件的特性对朴素贝叶斯算法做了改进,提出了改进朴素贝叶斯算法,该算法能够通过调整k值,降低合法邮件被错判为垃圾邮件的概率,从而最大程度减少用户的损失。  相似文献   

6.
基于贝叶斯分类的邮件过滤方法及模型研究   总被引:5,自引:1,他引:5  
垃圾邮件日益泛滥,给用户带来了极大的不便和危害.并对网络安全构成威胁.传统邮件过滤方法单一,过滤精度不高,已不能很好地满足需求.结合规则过滤技术,分析了基于文本内容的贝叶斯分类器实现的关键技术与方法,并给出核心过滤算法在邮件分类中的实现具体方法及过程,进而完成垃圾邮件的判别.为减少邮件的误判对用户造成的损害及垃圾邮件漏判造成的影响,提出相应的改进措施,使用最小风险贝叶斯决策减小误判率,对分类系统经训练部分进行自适应调整,最后给出基于规则与内容的双重防范机制的邮件过滤模型及基于该框架的邮件判别流程.  相似文献   

7.
电子邮件的普及给人们的生活带来极大的方便,但目前垃圾邮件的泛滥严重影响了用户的正常使用。贝叶斯算法因简单在英文邮件过滤中取得了良好的过滤效果,分析了贝叶斯算法的原理及其在垃圾邮件过滤中的应用,给出垃圾邮件过滤的整个过滤流程,设计并实现了一种语言无关的垃圾邮件过滤系统。  相似文献   

8.
基于数据挖掘的垃圾E-mail过滤方法   总被引:6,自引:0,他引:6  
分析了己有的垃圾E-mail过滤规则的算法的本质,给出了将邮件表示成事务的方法。在将垃圾邮件的训练集表示成事务集后,可以用FP-Tree算法从训练集中挖掘出频繁特征集。同时探讨了如何将一个频繁特征集表示成规则及如何使用规则的问题。  相似文献   

9.
特征选择在垃圾邮件过滤中起着十分重要的作用,本文分析讨论了现有邮件特征选择方法所存在的不足,并在此基础上,提出一种基于博弈论的邮件特征选择模型。该模型将博弈论应用于邮件特征选择中,以达到约减信息规模,提高垃圾邮件过滤效率的目的。在设计特征选择模型时,考虑到邮件样本自身的模糊隶属性对特征选择所产生的影响,在特征点对邮件类别的区分度定义中,通过引入由相融性度量定义的样本模糊隶属度函数,提高博弈邮件特征选择模型对实际问题的处理能力。在CDSCE语料库上的实验表明,该邮件特征选择模型的性能优于同类其他特征选择方法,验证了该邮件特征选择模型的有效性。  相似文献   

10.
大量重复发送的邮件是垃圾邮件的主要生成方式,为检测这种类型的垃圾邮件,作者提出了一种基于指纹向量的自适应垃圾邮件过滤方法.该方法中,每封邮件通过q元取样后映射成指纹向量,如果两个邮件的指纹向量的距离较小,则认为其属于同一个类别.该方法具有计算速度快、占用计算资源小的优点,与传统的贝叶斯算法相比具有较优的性能,在TREC2007数据集的实验结果验证了所提出方法的有效性.  相似文献   

11.
分析齿轮疲劳裂纹振动信号的特点,建立了一套以信号平均、滤波、移频等相结合的计算诊断方法,比较方便、有效.  相似文献   

12.
粗糙集理论在变压器故障诊断中的应用   总被引:7,自引:0,他引:7  
为了对变压器故障诊断过程中大量的冗余特征进行压缩或约简,提高诊断的效率,将粗糙集理论引入到变压器故障诊断中,提出了基于粗糙集理论的故障特征约简算法:即由故障样本构成信息表,组合表中不同的属性集,求取与全体属性集具有相同分类质量的最小属性集。对具体典型诊断实例进行了分析,结果表明:在保证故障分类结果不变的情况下,该算法能够剔除具有冗余信息的特征,找出对故障分类起主要作用的特征,从而达到了特征约简的目的,不仅大大减少了诊断信息提取的工作量,也为后续的智能诊断提供很大的便利。  相似文献   

13.
传统的流线可视化方法因视线遮挡和数据密集难以刻画流场特征,难以应对大规模数据,为此,从数据驱动的思路出发,提出了一种筛选三维流线的算法,实现对大规模精细流场的特征刻画.该算法对广泛撒点取得的流线集进行特征化,通过计算流线上各点的特征,并以此为依据对流线进行分段;基于所有分段的几何特征构建一组特征向量,并利用词袋方法建立一组词向量;以词向量为基础计算流线间的几何特征相似度,以评估各个流线间的相似性,实现对流线的筛选.通过在特定流线的查询和整体流线流场的压缩这2个典型应用场景上的应用,检验了该方法对流线筛选的效果.  相似文献   

14.
In light of degradation of particle filtering and robust weakness in the utilization of single feature tracking,this paper presents a kernel particle filtering tracking method based on multi-feature in...  相似文献   

15.
介绍了一种基于波形分析的数字式互感器校验仪,着重论述其测差原理及实现方法。该方法用波形采集的方法获得原始数据,与以往常见的采集信号瞬时值的方法相比,具有硬件电路简单、测量数据不受波形畸变车电路相位移影响的特点,具有较高的测量精度和稳定性。  相似文献   

16.
针对旋转机械振动参数图形边缘特征提取困难问题,根据模糊软形态学理论,提出滤波增强处理方法及自适应边缘检测算子.在600 MW模化汽轮机转子试验台上进行转子正常运转、转子不平衡故障、转子不对中故障、汽流激振故障、轴承松动故障的实验研究.将得到的振动参数三维图形转化为二维灰度图形,对二维灰度图形进行模糊软形态学滤波增强处理和自适应边缘检测.结果表明,该方法在滤除参数图形中噪声的同时,可以有效地提取图形边缘特征,为旋转机械故障诊断提供了一种新的图形特征提取方法.  相似文献   

17.
粗糙集理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具,文中以实例介绍了粗糙集的基本理论,并通过一个实例详细介绍了在基于对决策表属性约简的基础上采用了可变精度粗糙模型实现规则的获取. 该实例说明了基于粗糙集进行规则的挖掘是有效的.  相似文献   

18.
以简化信息处理的复杂性并提高信息处理精度为目标,提出了基于粗糙集神经网络系统的车牌字符识别方法.提取训练样本的特征向量建立决策表,基于粗糙集理论对决策表属性进行约简,由约简后的属性构造神经网络识别器.车牌字符识别试验结果验证了系统的有效性.  相似文献   

19.
在网络入侵检测中,由于原始数据特征维度高和冗余特征多,导致入侵检测系统的存储负担增加,检测分类器性能降低。针对该问题本文提出了一种基于信息论模型的入侵检测特征提取方法。它以具有最大信息增益的特征为搜索起点,利用搜索策略和评估函数迭代调整数据集分类标记、已选取特征子集和候选特征三者之间的相关度,最后通过终止条件确定选取特征子集。以入侵检测样本数据集为实验数据,将该方法选取的特征向量运用到支持向量机分类算法中,在特征维度大幅度降低的情况下,检测精度变化很小。实验结果证明了本方法的有效性。  相似文献   

20.
一种基于变精度粗糙集的规则提取方法研究   总被引:3,自引:0,他引:3  
主要研究了变精度粗糙集的下近似集,得到了变精度粗糙集的下近似集和属性集合基数之间的关系,提出了一种易实现的变精度粗糙集决策表约简算法。该算法分2步进行决策表约简计算:①计算决策表核;②在决策表核的基础上计算决策表最小约简。仿真实验结果表明所提出的变精度粗糙集约简算法计算简单、容易实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号