首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
维规约技术综述   总被引:1,自引:0,他引:1  
许明旺  施润身 《计算机应用》2006,26(10):2401-2404
从属性选择和维变换两个方面对维规约技术进行了概括。首先对属性选择的基本思想和常用算法进行简要介绍;然后对维变换技术中的几种应用最广泛的方法进行了详细研究,主要包括主成分分析及其相关算法、独立成分分析、因子分析、投影寻踪等方法,简要给出了这些方法间的联系和区别,最后指出了维规约技术的现状和发展方向。  相似文献   

2.
为提高贝叶斯模型在实际数据中处理相关性维度时的效率、精度,并保持其可解释性,本文提出一种改进的核朴素贝叶斯模型。首先通过关联规则挖掘相关维度子集,然后对这些子集进行降维处理,利用降维后的数据构建核朴素贝叶斯模型。实际应用的结果显示,该模型减少了降维对数据的影响,在保留有效信息的同时,提高了模型的可解释性。  相似文献   

3.
基于条件信息熵的自主式朴素贝叶斯分类算法   总被引:9,自引:0,他引:9  
朴素贝叶斯是一种简单而高效的分类算法,但其条件独立性和属性重要性相等的假设并不符合客观实际,这在某种程度上影响了它的分类性能。如何去除这种先验假设,根据数据本身的特点实现知识自主学习是机器学习中的一个难题。根据Rough Set的相关理论,提出了基于条件信息熵的自主式朴素贝叶斯分类方法,该方法结合了选择朴素贝叶斯和加权朴素贝叶斯的优点。通过在UCI数据集上的仿真实验,验证了该方法的有效性。  相似文献   

4.
基于信息几何构建朴素贝叶斯分类器   总被引:2,自引:0,他引:2  
朴素贝叶斯分类器是机器学习中一种简单而又有效的分期方法。但是由于它的属性条件独立性假设在实际应用中经常不成立,这影响了它的分类性能。本文基于信息几何和Fisher分,提出了一种新的创建属性集的方法。把原有属性经过Fisher分映射成新的属性集,并在新属性集上构建贝叶斯分类器。我们在理论上探讨了新属性间的条件依赖关系,证明了在一定条件下新属性间是条件独立的。试验结果表明,该方法较好地提高了朴素贝叶斯分类器的性能。  相似文献   

5.
基于朴素贝叶斯与ID3算法的决策树分类   总被引:2,自引:0,他引:2       下载免费PDF全文
v在朴素贝叶斯算法和ID3算法的基础上,提出一种改进的决策树分类算法。引入客观属性重要度参数,给出弱化的朴素贝叶斯条件独立性假设,并采用加权独立信息熵作为分类属性的选取标准。理论分析和实验结果表明,改进算法能在一定程度上克服ID3算法的多值偏向问题,并且具有较高的执行效率和分类准确度。  相似文献   

6.
朴素贝叶斯和决策树由于其较高的分类性能和简单性得到了广泛的使用,许多学者都在研究如何在分类前对数据进行处理以提升它们的分类性能。该文首先使用主成分分析提取特征数据,然后对处理后的数据上利用朴素贝叶斯和决策树进行分类,并对实验结果进行分析,比较主成分分析对它们分类性能的影响。  相似文献   

7.
由于朴素贝叶斯算法的特征独立性假设以及传统TFIDF加权算法仅仅考虑了特征在整个训练集的分布情况,忽略了特征与类别和文档之间关系,造成传统方法赋予特征的权重并不能代表其准确性.针对以上问题,提出了二维信息增益加权的朴素贝叶斯分类算法,进一步考虑到了特征的二维信息增益即特征类别信息增益和特征文档信息增益对分类效果的影响,并设计实验与传统的加权朴素贝叶斯算法相比,该算法在查准率、召回率、F1值指标性能上能提升6%左右.  相似文献   

8.
秦锋  任诗流  程泽凯  罗慧 《计算机工程与设计》2007,28(20):4873-4874,4877
朴素贝叶斯分类器是一种简单而高效的分类器,但需要属性独立性假设,无法表示现实世界中属性之间的依赖关系,影响了其分类性能.利用独立分量分析提升朴素贝叶斯分类性能,把样本投影到由独立分量所确定的特征空间,提高了朴素贝叶斯分类器的分类性能.实验结果表明,这种基于独立分量分析的朴素贝叶斯分类器具有良好的性能.  相似文献   

9.
针对朴素贝叶斯方法的缺点,提出了基于主分量分析方法的柴油机供油系统朴素贝叶斯诊断技术;该方法利用历史诊断记录,通过主分量分析方法对训练样本的输入维数进行约简,将高维相关的特征信号转换为低维相互独立的特征信号,并在此基础上进行贝叶斯诊断分析,从而改善了贝叶斯方法中要求的属性信息之间的独立性限制,实验结果表明,基于主成分分析方法的贝叶斯故障诊断技术对于简化诊断模型,减少算法执行时间,提高诊断速度具有重要作用。  相似文献   

10.
朴素贝叶斯是一种用于不确定性推理的方法,其原理简单,但是适用性却很强。将朴素贝叶斯用在文本分类中。在传统的文本分类方法的基础上,对文本特征的选择做了改进,通过实验,达到了比较满意的效果。  相似文献   

11.
通过对文本情感分类的研究,考虑微博文本信息的篇幅短小、情感符号丰富及大量网络词汇的特点,提出一种适用于中文微博情感分类的基于Map/Reduce的分布式朴素贝叶斯算法。算法通过构建适用于微博文本的情感词典来完成情感特征属性的提取,以期达到较为理想的分类效果。实验结果表明,这种方法能够很好地适用于微博情感分类,达到较理想的分类效果,满足针对海量的微博文本数据处理的可行性与高效性的需求。  相似文献   

12.
在分类方法中使用朴素贝叶斯法来超越市场指数.在给定上海证券交易所中所有交易的股票的基本会计和价格信息的情况下,我们试图使用朴素贝叶斯法来辨识那些超越市场指数而可望获得额外回报的股票.由朴素贝叶斯法选择的股票所组成的同等权重证券组合一年半内总共获得21%的回报,明显优于基于市场指数的-9%的回报.同时给出一个新的进行分类可靠性权衡的视角,朴素贝叶斯法的输出结果被排级,这样被用来进行类别确定的股票就可固定为占股票总数25%的股票.  相似文献   

13.
朴素贝叶斯分类器建立在其数据"特征值之间相互条件独立"的基础上,而在实际应用中该假设难以完全成立。针对这种现象提出一种算法,即通过寻找对产生错误分类影响最大的特征值,并依此特征值的关联项对数据项扩充,在此基础上对扩充项添加权重,以达到提升分类器精度的效果。最后对权重的大小加以论证,实验分析了不同大小的权重对分类器正确率的影响。实验结果表明,添加关联项扩充训练集,可以有效提升贝叶斯分类器的正确率。  相似文献   

14.
一种基于朴素贝叶斯分类的性能预测方法   总被引:1,自引:0,他引:1  
李祥  周波 《计算机应用与软件》2011,28(1):231-234,290
基于朴素贝叶斯分类提出了一种复杂应用系统的性能预测方法.利用应用系统性能测试的结果作为训练集,引入朴素贝叶斯分类方法训练分类器,再将该分类器包装成预测模块嵌入应用系统,对响应时间等多种性能属性进行预测.与传统方法相比,该方法具有准确度高、构造简单、效率高、鲁棒性强、松耦合等优势.在针对金融报表系统的对比实验中准确率达到...  相似文献   

15.
对简单贝叶斯过滤方法作一些应用方面的研究工作.首先讨论了简单贝叶斯的垃圾邮件过滤,在PU1语料上实现了简单贝叶斯算法,通过不同的特征词选取方法,得到了比前人更好的结果,给出了特征数、阈值等参数和过滤效果间的关系,并得出了较优的参数设定.然后讨论了基于简单贝叶斯的中文邮件过滤,并在自己收集整理建立的中文邮件语料库上进行中文邮件过滤的实验,得出了不同于英文邮件的较优的参数设定.  相似文献   

16.
高校贫困生的贫困程度判定可以归属于构建分类模型对样本数据进行训练。但单个分类模型的精准度要取决于处理样本数据的大小和类型复杂度,在模型速度和准确性之间不易取舍。集成多个分类算法可以避免单个分类算法的过拟合。通过邻域分量分析(Neighborhood Component Analysis, NCA)进行特征降维降低初始分类模型的计算成本,对误判损失引入一个成本函数进行惩罚的同时采用贝叶斯优化进行超参数调优。结果表明,改进后的分类模型泛化能力得到明显提升。计算时间成本降低的同时,误判率由初始的8%下降到5%,模型的准确率提升了近4%。  相似文献   

17.
针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题.在使用概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对单词序列构造规模相当的样本集并将估计出的参数的平均值作为训练得到的最终参数对未知文本进行分类.公共文本实验数据集上的实验结果表明,提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单.  相似文献   

18.
提出并实现了一个基于贝叶斯的冬态树木自动分类的系统.通过分析树木体系的特征,研究并分析了可能影响树木分类结果的几个方面,提出了树木分类建模时应该考虑的因素,并将其归纳为六个方面,从中抽取与分类最相关的内容和信息,构建了冬态树木分类的模型,最后用贝叶斯方法实现了该分类模型,完成了基于贝叶斯的冬态树木分类系统.系统实现了树木分类中各特征项参数的自学习功能,以便在使用分类过程中,根据实际情况,自学习参数,达到最佳的分类效果.实验结果表明所提出的分类方法可以较好地解决冬态树木的自动分类问题.  相似文献   

19.
朴素贝叶斯分类方法由于其简单快速的特点,被广泛应用于文本分类领域。但是当训练集中各个类别的样本数据分布不均匀时,朴素贝叶斯方法分类精度不太理想。针对此问题,提出一种基于加权补集的朴素贝叶斯文本分类算法,该算法利用某个类别的补集的特征来表示当前类别的特征,且对特征权重进行归一化处理。通过实验对比了该方法与传统的朴素贝叶斯方法对文本分类效果的影响,结果表明,基于加权补集的朴素贝叶斯算法具有较好的文本分类效果。  相似文献   

20.
运用知识库系统中数据分类知识的结构性特点,确定搜索最小约简解的下界;结合启发式约简算法获得的可行解为搜索上界,则可获得大大缩小的最小约简解搜索区间。在区间内优化搜索算法,快速地获得了数据集的最小约简解集。实例证明该运算途径简易、有效,为获取最小约简解的算法研究提供了参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号