首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
一种文本处理中的朴素贝叶斯分类器   总被引:22,自引:0,他引:22  
首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题。然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器的应用,提高了朴素贝叶斯分类器的分类精度。文章最后给出一组实验数据。本文的研究发现,朴素贝叶斯分类器分类精度较高,并且不存在单分类器与多分类器的实现差异,是一个比较实用的分类器。  相似文献   

2.
基于粗糙集和朴素贝叶斯的垃圾邮件过滤系统   总被引:1,自引:1,他引:0  
提出了基于粗糙集理论和贝叶斯分类算法的垃圾邮件过滤方法。利用粗糙集约简算法对邮件样本集进行特征约简,删除对邮件过滤结果影响不大的冗余特征,从而降低了输入样本集的维数,解决了贝叶斯分类器训练时间长,样本集占用的存储空间过大的问题。实验证明,该方法可以提高邮件过滤  相似文献   

3.
单词的共同出现信息可以为文本分类做出贡献,但是.目前的文本分类研究中未能充分使用这一信息。文中提出了一种利用关联特征来提高朴素贝叶斯文本分类器性能的策略.给出了关联特征集的构造方法,设计并实现了冗余关联特征剔除算法和关联特征筛选算法,使得特征空间中的每个特征都具有较强的分类能力。实验证明,经处理后的关联特征集可以提高朴素贝叶斯文本分类器的性能。  相似文献   

4.
模式分类旨在依据识别对象特征的观察值将其归并至某个类别,贝叶斯分类决策可实现模式分类.给出一类遵从特征观察量独立性假设的贝叶斯分类器即朴素贝叶斯分类器设计.并给出朴素贝叶斯分类器的分类误差估计方法.理论分析与实验结果表明,朴素贝叶斯分类器设计方案可行,且其分类误差估计方法有效,可用于模式分类事务处理.  相似文献   

5.
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

6.
在已有上机实验数据的基础上,使用综合的权值计算方法,将加权朴素贝叶斯分类算法应用到学生成绩分析与预测中.实验结果显示,对于学生的成绩分类,使用综合权值的结果优于传统权值的分类结果,表明使用文中的加权贝叶斯方法分析学生成绩是切实可行的.  相似文献   

7.
朴素贝叶斯分类器的一种改进方法就是突破属性独立性假设的限制,表达属性间的相关性。但过多地表达属性间的相关性会增加扩展朴素贝叶斯分类器的复杂度。x~2统计是属性间相关性的度量方法,通过对属性相关性的度量,对属性进行分组,将相关性较强的属性分在一组,各个属性分组之间相互条件独立。只在各个属性分组内通过添加有向边的方式表达相关属性间的相关性,将朴素贝叶斯分类器的扩展限定在每个属性分组内,从而简化扩展朴素贝叶斯分类器的结构,提高分类正确率。  相似文献   

8.
针对WWW的HTML(Hyper Text Markup Language)结构采用TFE表示,给出一种新的TFE实现方法,进而提出了一种改进的朴素贝叶斯分类算法,然后对该算法的准确性和有效性进行讨论.  相似文献   

9.
朴素贝叶斯分类器是目前公认的一种简单有效的概率分类方法,具有简单、健壮而且高效的特点,但由于它是建立在属性变量相对类变量独立的假设前提下,而且这个假设在实际问题中往往不能满足,从而影响了其分类精度。针对这个很强的前提假设,提出了基于灰色关联聚类的特征选择方法,在一定程度上放松了这个限制条件;以朴素贝叶斯分类器作为基分类器,采用分类器集成技术中的AdaBoost算法进一步提高分类性能。通过对新英格兰10机39节点系统的仿真计算,结果表明了方法的有效性和正确性。  相似文献   

10.
摘。要:选取了影响煤与瓦斯突出的5个因素作为属性条件,把突出强度作为目标变量,利用训练样本对朴素贝叶斯分类器模型进行了学习训练,对测试样本进行了预测,从结果来看精确度较高.因此朴素贝叶斯分类器模型预测煤与瓦斯突出强度是有效的.  相似文献   

11.
一种HTML文档的朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
针对WWW的HTML(HyperTextMarkupLanguage)结构采用TFE表示,给出一种新的TFE实现方法,进而提出了一种改进的朴素贝叶斯分类算法,然后对该算法的准确性和有效性进行讨论.  相似文献   

12.
基于知识语义权重特征的朴素贝叶斯情感分类算法   总被引:1,自引:0,他引:1  
针对文档级情感分类的准确率低于普通文本分类的问题, 提出一种基于知识语义权重特征的朴素贝叶斯情感分类算法.首先, 通过特征选择的方法, 对情感词典中的词进行重要度评分并赋予不同权重.然后, 基于词典极性的分布信息与文档情感分类的相关性, 将情感词的语义权重特征融合到朴素贝叶斯分类中, 实现了新算法.在标准中文数据集上的实验结果表明, 提出的算法在准确率、召回率和F1测度值上都优于已有的一些算法.  相似文献   

13.
文本分类是当今信息检索和数据挖掘等领域的研究热点,而特征加权是文本分类过程中的重要步骤.为了提高分类质量,文章通过深入分析粗糙集理论和逆文本频率加权的思想,提出了一种基于粗糙集的特征加权方法,从近似分类精度和近似分类质量两个方面考虑特征词对分类的全局作用,将文本的类别属性信息引入到权重中.通过文本分类实验证明,该加权方法有助于提高分类系统的分类效果.  相似文献   

14.
针对朴素贝叶斯算法应用于反垃圾邮件过滤时,其有效性十分依赖于对邮件内容的有效建模,而邮件内容建模方面研究尚不成熟限制了贝叶斯方法在垃圾邮件过滤中的性能.采用了三种概率分布对邮件内容进行建模,据此提出了3种概率分布下的朴素贝叶斯算法.为了提高训练效率,算法采用了一种增量式的垃圾邮件过滤方法.在trec05p-1、trec06p两个公开数据集上对这3种贝叶斯算法进行了实验对比,分析出三种贝叶斯分布的适用范围.从不同分布的邮件内容建模角度出发,为过滤垃圾邮件的方法选择提供了有效依据.  相似文献   

15.
针对武器装备试验数据挖掘问题,在朴素贝叶斯预测的基础上,引入遗传算法修正影响因素水平的权重系数,构建一种基于改进朴素贝叶斯的武器装备性能预测模型.通过某地面突击装备火力打击毁伤概率预测案例,验证改进朴素贝叶斯预测模型与传统贝叶斯性能预测模型相比具备更高的预测准确性,可为装备试验数据挖掘提供更为可靠的方法.  相似文献   

16.
机器学习与数据挖掘是研究从数据中提取知识的理论和技术,目前这些理论与技术在世界主要经济领域中日益得到广泛应用。分类模型是机器学习和数据挖掘最重要的研究内容之一。在众多的分类方法中,贝叶斯分类器在计算上具有非常高的效率,在某些应用问题上表现出诱人的分类精度,因而广泛地应用于许多实际领城中。为进一步对这一领域展开研究,介绍了贝叶斯分类器的原理、当前现状及下一步的研究重点。  相似文献   

17.
保持隐私的朴素贝叶斯分类   总被引:3,自引:0,他引:3       下载免费PDF全文
隐私保护是数据挖掘中很有意义的研究方向。本文所关心的问题是如何在两个私有数据库的联合样本集上施行数据挖掘算法,同时保证不向对方泄露任何与结果无关的数据库信息。这种情形在科研合作等领域已经屡见不鲜。针对数据分类算法中应用非常普遍的朴素贝叶斯分类算法,我们利用安全两方计算协议,给出一个保持隐私的朴素贝叶斯分类协议,在保持计算隐私性的同时,协议在计算复杂度和传输复杂度与一般的贝叶斯分类非常接近,协议是高效可行的。  相似文献   

18.
为解决路面积雪状态(轻微、严重)检测问题以保证行车安全,利用监控视频得到路面实时状态,采用朴素贝叶斯分类方法进行积雪状态检测。首先利用机器视觉和视频目标分割方法提取视频中路面视觉特征,然后采用朴素贝叶斯分类方法进行路面积雪状态分类,通过实验,综合比较了朴素贝叶斯分类与KNN分类、人工神经网络(ANN)、支撑向量机(SVM)在路面积雪状态检测问题中的有效性,结果表明,朴素贝叶斯分类器更适合积雪状态的分类。  相似文献   

19.
基于朴素贝叶斯算法的垃圾邮件过滤器是目前比较高效、经济的垃圾邮件过滤技术之一,它已经广泛应用到垃圾邮件过滤领域。文章在对朴素贝叶斯过滤器分析的基础上,针对朴素贝叶斯算法的缺陷结合损失最小化的思想,并根据垃圾邮件的特性对朴素贝叶斯算法做了改进,提出了改进朴素贝叶斯算法,该算法能够通过调整k值,降低合法邮件被错判为垃圾邮件的概率,从而最大程度减少用户的损失。  相似文献   

20.
一种基于模糊积分的多分类器联合方法   总被引:3,自引:0,他引:3  
多分类器联合是解决复杂模式识别问题的有效办法。模糊积分是一种多分类器联合算法。但是在用模糊积分对多分类器联合建模时,模糊积分密度函数的选择对系统的性能有着很大的影响。提出一种基于模糊积分和贝叶斯联合的分类器集成方法,该方法利用贝叶斯方法的构造只分密度函数,再利用模糊积分把分类器输出信息联合起来。实验结果表明,该方法比其他方法能够得到更好的识别性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号