共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
3.
4.
基于特征加权的朴素贝叶斯分类器 总被引:13,自引:0,他引:13
朴素贝叶斯分类器是一种广泛使用的分类算法,其计算效率和分类效果均十分理想。但是,由于其基础假设“朴素贝叶斯假设”与现实存在一定的差异,因此在某些数据上可能导致较差的分类结果。现在存在多种方法试图通过放松朴素贝叶斯假设来增强贝叶斯分类器的分类效果,但是通常会导致计算代价大幅提高。该文利用特征加权技术来增强朴素贝叶斯分类器。特征加权参数直接从数据导出,可以看作是计算某个类别的后验概率时,某个属性对于该计算的影响程度。数值实验表明,特征加权朴素贝叶斯分类器(FWNB)的效果与其他的一些常用分类算法,例如树扩展朴素贝叶斯(TAN)和朴素贝叶斯树(NBTree)等的分类效果相当,其平均错误率都在17%左右;在计算速度上,FWNB接近于NB,比TAN和NBTree快至少一个数量级。 相似文献
5.
本文使用“事件研究”方法分析了证券分析师推荐股票的总体特征,试图找出符合这些特征的股票而获得超额回报,并应用基本贝叶斯分类方法进行选股。经对上证A股的所选股票的收益率统计分析,通过合理地选取贝叶斯分类器参数可以获得较好回报。结果表明了这种方法是有实际意义和效果的。 相似文献
6.
本文使用"事件研究"方法分析了证券分析师推荐股票的总体特征,试图找出符合这些特征的股票而获得超额回报,并应用基本贝叶斯分类方法进行选股。经对上证A股的所选股票的收益率统计分析,通过合理地选取贝叶斯分类器参数可以获得较好回报。结果表明了这种方法是有实际意义和效果的。 相似文献
7.
研究了邮件过滤的主要方法,提出了将Agent技术、粗糙集和最小风险的Bayes分类方法结合的邮件过滤及个性化分类模型。该模型首先利用粗糙集方法对邮件样本向量空间进行约简,然后利用已知样本对最小风险的Bayes分类器进行训练,得到具有智能分类功能的邮件分类器,利用该分类器过滤掉用户不感兴趣的邮件,并利用Agent学习用户的个性化知识,最后利用学习的知识将用户感兴趣邮件进行再分类。 相似文献
8.
Naive Bayesian分类器是一种有效的文本分类方法,但由于具有较强的稳定性,很难通过Boosting机制提高其性能。因此用Naive Bayesian分类器作为Boosting的基分类器需要解决的最大问题,就是如何破坏Naive Bayesian分类器的稳定性。提出了3种破坏Naive Bayesian学习器稳定性的方法。第一种方法改变训练集样本,第二种方法采用随机属性选择社团,第三种方法是在Boosting的每次迭代中利用不同的文本特征提取方法建立不同的特征词集。实验表明,这几种方法各有其优缺点,但都比原有方法准确、高效。 相似文献
9.
基于信息几何构建朴素贝叶斯分类器 总被引:2,自引:0,他引:2
朴素贝叶斯分类器是机器学习中一种简单而又有效的分期方法。但是由于它的属性条件独立性假设在实际应用中经常不成立,这影响了它的分类性能。本文基于信息几何和Fisher分,提出了一种新的创建属性集的方法。把原有属性经过Fisher分映射成新的属性集,并在新属性集上构建贝叶斯分类器。我们在理论上探讨了新属性间的条件依赖关系,证明了在一定条件下新属性间是条件独立的。试验结果表明,该方法较好地提高了朴素贝叶斯分类器的性能。 相似文献
10.
11.
学习过程评价既可实时监控学习的每一个步骤,也可有效发挥评价的反馈与调节、激励与促进作用.由于贝叶斯分类方法综合了先验信息和样本数据的概率分布,因此将其应用于数字化学习过程评价,具有较高的科学性,是数据挖掘技术与教育管理相结合的有益探索.实验结果表明,评价客观、一致,具有较高准确性. 相似文献
12.
朴素贝叶斯分类器可以应用于岩性识别.该算法常使用高斯分布来拟合连续属性的概率分布,但是对于复杂的测井数据,高斯分布的拟合效果欠佳.针对该问题,提出基于EM算法的混合高斯概率密度估计.实验选取苏东41-33区块下古气井的测井数据作为训练样本,并选取44-45号井数据作为测试样本.实验采用基于EM算法的混合高斯模型来对测井数据变量进行概率密度估计,并将其应用到朴素贝叶斯分类器中进行岩性识别,最后用高斯分布函数的拟合效果作为对比.结果表明混合高斯模型具有更好的拟合效果,对于朴素贝叶斯分类器进行岩性识别的性能有不错的提升. 相似文献
13.
基于多重判别分析的朴素贝叶斯分类器 总被引:4,自引:1,他引:4
通过分析朴素贝叶斯分类器的分类原理,并结合多重判别分析的优点,提出了一种基于多重判别分析的朴素贝叶斯分类器DANB(Discriminant Analysis Naive Bayesian classifier).将该分类方法与朴素贝叶斯分类器(Naive Bayesian classifier, NB)和TAN分类器(Tree Augmented Naive Bayesian classifier)进行实验比较,实验结果表明在大多数数据集上,DANB分类器具有较高的分类正确率. 相似文献
14.
属性加权的朴素贝叶斯集成分类器 总被引:1,自引:1,他引:1
为提高朴素贝叶斯分类器的分类精度和泛化能力,提出了基于属性相关性的加权贝叶斯集成方法(WEBNC)。根据每个条件属性与决策属性的相关度对其赋以相应的权值,然后用AdaBoost训练属性加权后的BNC。该分类方法在16个UCI标准数据集上进行了测试,并与BNC、贝叶斯网和由AdaBoost训练出的BNC进行比较,实验结果表明,该分类器具有更高的分类精度与泛化能力。 相似文献
15.
16.
基于改进朴素贝叶斯算法的入侵检测系统 总被引:2,自引:0,他引:2
随着互联网连通性的不断增强以及网络流量的日益增大,最近频繁发生的入侵事件再度凸显了入侵检测系统的重要性。针对朴素贝叶斯算法的缺陷,提出了一种改进后的朴素贝叶斯算法。该算法在原有的朴素贝叶斯模型基础上巧妙地引入属性加值算法,通过对分类参数的调控来实现简化分类数据复杂度的作用,并以计算出的最佳参数值来优化分类精确度。最后结合实验结果证明,在入侵检测框架中引入改进算法能够大幅度地降低入侵检测系统的误警率,从而提高系统的检测效率,减少网络攻击所带来的经济损失。 相似文献
17.
18.
朴素贝叶斯(NB)分类算法虽是一种简单且有效的分类方法,但其条件属性独立性假设忽略了属性变量间存在的相关性。考虑到条件独立性假设对分类效果的影响,提出一种新的将条件属性进行聚类的分组技术,不仅避免了传统朴素贝叶斯算法假设各条件属性间独立的这一缺陷,而且反映出了在不同类别情况下条件属性间具有的不同依赖程度。经过对UCI的几个数据集的仿真实验,结果表明了新算法的有效性。 相似文献
19.
多种策略改进朴素贝叶斯分类器 总被引:7,自引:1,他引:7
朴素贝叶斯分类器是一种简单而高效的分类器,但是它的属性独立性假设使其无法表示现实世界属性之间的依赖关系,影响了它的分类性能。通过广泛深入的研究,对改进朴素贝叶斯分类器的多种策略进行了系统的分析和归类整理,为进一步的研究打下坚实的基础。 相似文献
20.
人工免疫原理在邮件过滤中的应用 总被引:1,自引:0,他引:1
分析在垃圾邮件过滤中应用人工免疫原理的可行性,对应用中的的关键环节和算法进行了深入研究,并实现了基于人工免疫原理的邮件过滤器AISEF。利用SpamAssassin的邮件样本集进行训练和变异样本集进行识别测试,实验结果表明,对具有变异特性的垃圾邮件,AISEF具有比Bayes过滤器更好的适应性和稳定性。 相似文献