首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
一种文本处理中的朴素贝叶斯分类器   总被引:22,自引:0,他引:22  
首先在特征独立性假设的基础上,讨论了朴素贝叶斯分类器的原理,以及训练朴素贝叶斯分类器和应用朴素贝叶斯分类器进行分类的问题。然后,通过EM算法(期望值最大算法),自动增加训练量,以得到较为完备的训练文本库,扩展了朴素贝叶斯分类器的应用,提高了朴素贝叶斯分类器的分类精度。文章最后给出一组实验数据。本文的研究发现,朴素贝叶斯分类器分类精度较高,并且不存在单分类器与多分类器的实现差异,是一个比较实用的分类器。  相似文献   

2.
朴素贝叶斯分类器是一种简单高效的分类算法,但其属性独立性假设影响了分类效果。通过放松朴素贝叶斯假设可以增强朴素贝叶斯的分类效果,但是通常会导致计算代价大幅提高。针对以上问题,提出了一种基于粗糙集的特征加权朴素贝叶斯算法,加权参数直接从训练数据中学习得到,可以看作是计算某个后验概率时,某个特征对于该类别的影响程度。将该分类算法与朴素贝叶斯分类器(na ve bayesian classifier,NB)、贝叶斯网(bayes networks)和NBTree分类器进行实验比较。结果表明:在大多数数据集上,FWNB分类器在较小的计算代价下,具有较高的分类正确率。  相似文献   

3.
针对朴素贝叶斯分类器硬分类的不足,将模糊C-均值聚类与朴素贝叶斯分类相结合,提出一类新的基于模糊聚类的混合朴素贝叶斯分类模型,并给出它的分类误差估计方法。理论分析与实验结果表明,基于模糊聚类的混合朴素贝叶斯分类模型可行,其分类的误差估计方法有效。新的基于模糊聚类的混合朴素贝叶斯分类模型提高了模式分类能力。  相似文献   

4.
文本分类是数据挖掘领域中重要的研究分支.通过对自适应遗传算法和朴素贝叶斯分类器的研究,提出一种基于自适应遗传算法的朴素贝叶斯分类算法.将该算法应用于中文文本分类中,可以生成最优贝叶斯分类器及最优属性集合,提高分类精度.  相似文献   

5.
单词的共同出现信息可以为文本分类做出贡献,但是.目前的文本分类研究中未能充分使用这一信息。文中提出了一种利用关联特征来提高朴素贝叶斯文本分类器性能的策略.给出了关联特征集的构造方法,设计并实现了冗余关联特征剔除算法和关联特征筛选算法,使得特征空间中的每个特征都具有较强的分类能力。实验证明,经处理后的关联特征集可以提高朴素贝叶斯文本分类器的性能。  相似文献   

6.
基于粗糙集和朴素贝叶斯的垃圾邮件过滤系统   总被引:1,自引:1,他引:0  
提出了基于粗糙集理论和贝叶斯分类算法的垃圾邮件过滤方法。利用粗糙集约简算法对邮件样本集进行特征约简,删除对邮件过滤结果影响不大的冗余特征,从而降低了输入样本集的维数,解决了贝叶斯分类器训练时间长,样本集占用的存储空间过大的问题。实验证明,该方法可以提高邮件过滤  相似文献   

7.
朴素贝叶斯分类器的一种改进方法就是突破属性独立性假设的限制,表达属性间的相关性。但过多地表达属性间的相关性会增加扩展朴素贝叶斯分类器的复杂度。x~2统计是属性间相关性的度量方法,通过对属性相关性的度量,对属性进行分组,将相关性较强的属性分在一组,各个属性分组之间相互条件独立。只在各个属性分组内通过添加有向边的方式表达相关属性间的相关性,将朴素贝叶斯分类器的扩展限定在每个属性分组内,从而简化扩展朴素贝叶斯分类器的结构,提高分类正确率。  相似文献   

8.
摘。要:选取了影响煤与瓦斯突出的5个因素作为属性条件,把突出强度作为目标变量,利用训练样本对朴素贝叶斯分类器模型进行了学习训练,对测试样本进行了预测,从结果来看精确度较高.因此朴素贝叶斯分类器模型预测煤与瓦斯突出强度是有效的.  相似文献   

9.
机器学习与数据挖掘是研究从数据中提取知识的理论和技术,目前这些理论与技术在世界主要经济领域中日益得到广泛应用。分类模型是机器学习和数据挖掘最重要的研究内容之一。在众多的分类方法中,贝叶斯分类器在计算上具有非常高的效率,在某些应用问题上表现出诱人的分类精度,因而广泛地应用于许多实际领城中。为进一步对这一领域展开研究,介绍了贝叶斯分类器的原理、当前现状及下一步的研究重点。  相似文献   

10.
在产品的使用寿命服从指数分布的情形下,进行Ⅱ型截尾的步进应力加速寿命试验,而指数分布参数λ的先验分布为Г(α,β)分布时,本文研究了在十次损失函数下的贝叶斯估计及在历史样本的条件下经验贝叶斯估计,并给出一个计算实例。  相似文献   

11.
为解决路面积雪状态(轻微、严重)检测问题以保证行车安全,利用监控视频得到路面实时状态,采用朴素贝叶斯分类方法进行积雪状态检测。首先利用机器视觉和视频目标分割方法提取视频中路面视觉特征,然后采用朴素贝叶斯分类方法进行路面积雪状态分类,通过实验,综合比较了朴素贝叶斯分类与KNN分类、人工神经网络(ANN)、支撑向量机(SVM)在路面积雪状态检测问题中的有效性,结果表明,朴素贝叶斯分类器更适合积雪状态的分类。  相似文献   

12.
Classification can be regarded as dividing the data space into decision regions separated by decision boundaries.In this paper we analyze decision tree algorithms and the NBTree algorithm from this per...  相似文献   

13.
针对不确定性数据的分类问题,提出一种基于直方图估计的不确定性朴素贝叶斯分类器(HU-NBC).基于直方图估计的思想,建立估计不确定性数据概率密度函数的数学模型,并利用该模型估计不确定性朴素贝叶斯分类器的类条件概率密度函数.实验结果表明,与同类型算法相比,基于直方图估计的HU-NBC算法拥有较优的分类精度、较小的时间代价和空间需求,适合解决数据量较大的不确定性数据分类问题.  相似文献   

14.
针对目前大量垃圾信息充斥用户电子邮箱的问题,提出一种基于用户模型的电子邮件自动处理方法.它根据机器学习的原理,建立并且不断更新用户模型,记录用户的历史行为,并能够将历史数据作为训练样例,当训练样例达到适当的数量时,通过朴素贝叶斯分类法对新邮件进行归类,并采取相应的动作,最终帮助用户获取并保留更有价值的邮件信息.  相似文献   

15.
贝叶斯文本分类中特征词缺失的补偿策略   总被引:2,自引:0,他引:2  
为了解决朴素贝叶斯分类器在处理文本分类任务时,往往存在的特征词缺失问题,即由于语料库中的词语出现分布情况遵循Zipf定律,仅依靠简单的增加训练语料方式难以解决这种因数据稀疏而引发的特征词缺失问题.引入统计语言模型中的数据平滑算法,通过从已出现词中"折扣"出一定的概率再分配到未出现词中去,来计算缺失特征词的补偿概率,以此克服数据稀疏问题带来的影响.评测数据在去掉停用词的分类过程开放测试中,引入Good-Turing算法的分类性能比Laplace原则提高了3.05%,比Lidstone方法提高1.00%.而在交叉熵选择特征词的算法中,增加Good-Turing的贝叶斯分类方法可比最大熵分类性能高1.95%.通过这种数据平滑的算法,有助于克服因数据稀疏而引发的特征词缺失问题.  相似文献   

16.
SVM回归与朴素贝叶斯分类相结合的变压器故障诊断   总被引:1,自引:0,他引:1  
针对传统变压器故障诊断中的对于原始测试数据完备性和准确性的限制,提出并构建用于变压器故障诊断的NB模型;并在此基础上针对NB模型缺失关键属性时诊断性能大大降低的弱点,提出用SVM回归法填补缺失属性,构建SVM回归预测与NB相结合的变压器故障诊断模型。实验表明在属性缺失多及缺失关键属性时,SVM回归预测的应用能够明显提高诊断的正判率。  相似文献   

17.
对于极化合成孔径雷达(SAR)图像,由于雷达角度和地物形状导致属于同一类的数据可能存在较大的差异性.针对此问题提出了一种基于贝叶斯集成框架的极化SAR图像分类方法.该算法采用贝叶斯集成,通过学习不同个体而获得的分类面来改善极化SAR图像分类性能.首先,输入极化SAR图像,并获得其对应的极化SAR数据及特征.从图像的每一类中任意选择像素点作为图像分类的原始训练样本,并对其进行随机划分获得不同的样本子集.然后,基于获得的样本子集构造对应极化SAR图像的贝叶斯集成框架.最后,通过构造的贝叶斯集成框架对极化SAR图像进行分类.特别在构造贝叶斯集成框架中采用支撑矢量机作为基本的分类器算法.实验结果表明,所提出的算法相比经典的极化SAR分类方法和单个SVM的极化SAR分类方法获得更好的分类性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号