首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 178 毫秒
1.
针对二支决策TAN分类器在处理不确定数据时有较高的错误率,提出一种新的三支扩展TAN贝叶斯分类器(3WDTAN).首先通过构建TAN贝叶斯分类模型,采用先验概率和类条件概率估计三支决策中的条件概率;其次构建3WD-TAN分类器,制定3WD-TAN分类器中正域,负域和边界域的三支分类规则,结合边界域处理不确定性数据的优势,在一定程度上纠正了传统TAN贝叶斯分类器产生的分类错误;最后通过在5个UCI数据集上选取NB、TAN、SETAN算法进行对比实验,表明3WD-TAN具有较高的准确率和召回率,且适用于不同规模数据集的分类问题.  相似文献   

2.
通过分析朴素贝叶斯分类器与树扩张型朴素贝叶斯(TAN)分类器,提出了一种新的属性依赖度量方法,并依此对TAN分类器的构造方法进行了改进.将该分类方法(XINTAN)与朴素贝叶斯分类器和TAN分类器进行了实验比较.实验结果表明,此分类方法集中了朴素贝叶斯分类器与树扩张型朴素贝叶斯(TAN)分类器的优点,性能要优于TAN分类器.  相似文献   

3.
基于特征加权的朴素贝叶斯分类器   总被引:13,自引:0,他引:13  
程克非  张聪 《计算机仿真》2006,23(10):92-94,150
朴素贝叶斯分类器是一种广泛使用的分类算法,其计算效率和分类效果均十分理想。但是,由于其基础假设“朴素贝叶斯假设”与现实存在一定的差异,因此在某些数据上可能导致较差的分类结果。现在存在多种方法试图通过放松朴素贝叶斯假设来增强贝叶斯分类器的分类效果,但是通常会导致计算代价大幅提高。该文利用特征加权技术来增强朴素贝叶斯分类器。特征加权参数直接从数据导出,可以看作是计算某个类别的后验概率时,某个属性对于该计算的影响程度。数值实验表明,特征加权朴素贝叶斯分类器(FWNB)的效果与其他的一些常用分类算法,例如树扩展朴素贝叶斯(TAN)和朴素贝叶斯树(NBTree)等的分类效果相当,其平均错误率都在17%左右;在计算速度上,FWNB接近于NB,比TAN和NBTree快至少一个数量级。  相似文献   

4.
5.
比较了朴素贝叶斯分类器的一些改进算法,提出了新的TTree分类器,采用决策树分割实例集,在叶节点建立TAN分类器.实验分析表明,TTree算法与NBTree、TAN、Na(i)ve-bayes相比,有较高的分类准确率.该分类器应用到电信CRM客户建模中,得到了较好的分类结果.  相似文献   

6.
现代社会网络招聘兴起,为社会、企业节省了不少物力、人力、财力,但如何快速、简捷地从众多的电子简历中找出符合要求的简历又是一个让人头疼的问题.文中在贝叶斯网络的基础上,分别从朴素贝叶斯分类器和 TAN 分类器角度,构建一个基于贝叶斯分类器的电子简历筛选模型,并通过实验验证该模型对电子简历进行分类时的准确率和查全率,且引入一个新的评价指标 f 同时考虑准确率和查全率,得出没有属性变量相互独立限制的 TAN 分类器具有较好的分类效果的结论.  相似文献   

7.
分类是数据挖掘中很重要的一个组成部分,利用贝叶斯理论的分类算法分类准确,可解释性强。本文对基于贝叶斯理论的分类算法进行分析总结,首先阐明了贝叶斯理论,介绍了基于贝叶斯理论的朴素贝叶斯分类器、TAN模型分类算法、AODE分类算法和AnDE分类算法及其原理,以及各个算法的特征。  相似文献   

8.
朴素贝叶斯分类器(Na(i)ve Bayes,NB)因其简单、高效的特性,被广泛应用于诸多领域,然而其属性独立的假设在现实世界往往并不成立.因此许多学者针对这个问题进行了大量的研究,其中较有代表性的算法有懒惰贝叶斯规则分类器(Lazy learning of Bayesian Rules,LBR),增强树贝叶斯分类器(Tree Augmented Naive Bayes,TAN)和平均单依赖分类器(Averaged One-Dependence Estimator,AODE).而AODE分类器以较快的训练速度和较好的分类精度尤为引人注日.该算法原理是:把所有单依赖分类器(Super Parent One-Dependence Estimator,SPODE)的预测概率加起来求平均,并以平均预测概率进行分类.这种简单求平均的集成方法没有考虑到每个SPODE贡献的大小,因此分类精度达不到最优.为了弥补这种不足,我们提出一种加权SPODE集成框架,为每个SPODE赋予合适的权值,权值通过优化算法计算得到.因为是在次优解的附近寻优,所以计算时问很短.实验表明新算法比NB、AODE、WAODE、LBR和TAN等算法具有更好的性能.  相似文献   

9.
基于有向树算法构造的TAN分类器   总被引:1,自引:0,他引:1  
树扩展型朴素贝叶斯(TAN)分类器放松了朴素贝叶斯的属性独立性假设,是对朴素贝叶斯分类器的有效改进.但传统TAN的构造算法中树的根结点是随意选择的,这使得其无法精确表达属性间的依赖关系.通过将依赖关系设定方向,并将有向树算法引入TAN分类器的构造,提出了一种新的TAN模型构造方法--DTAN.实验结果表明,DTAN分类方法在实例个数比较多的数据集上具有显著优秀的分类性能.  相似文献   

10.
用于数据挖掘的TAN分类器的研究与应用   总被引:2,自引:0,他引:2  
分类是数据挖掘和模式识别中的一个基本和重要的课题。文中讨论了基于贝叶斯学习的TAN分类器的基本概念和分类算法,同时将分类器算法和具体分类算法结合为一个完整的有效算法。用某高校人才识别系统这一实例来说明TAN分类器的推理过程,并介绍了TAN分类器在数据挖掘领域的应用。实验结果表明TAN分类器具有较好的分类性能和较高的分类精度。  相似文献   

11.
Having received considerable interest in recent years, associative classification has focused on developing a class classifier, with lesser attention paid to the probability classifier used in direct marketing. While contributing to this integrated framework, this work attempts to increase the prediction accuracy of associative classification on class imbalance by adapting the scoring based on associations (SBA) algorithm. The SBA algorithm is modified by coupling it with the pruning strategy of association rules in the probabilistic classification based on associations (PCBA) algorithm, which is adjusted from the CBA for use in the structure of the probability classifier. PCBA is adjusted from CBA by increasing the confidence through under-sampling, setting different minimum supports (minsups) and minimum confidences (minconfs) for rules of different classes based on each distribution, and removing the pruning rules of the lowest error rate. Experimental results based on benchmark datasets and real-life application datasets indicate that the proposed method performs better than C5.0 and the original SBA do, and the number of rules required for scoring is significantly reduced.  相似文献   

12.
陈筱倩  王宏远 《计算机科学》2009,36(12):183-186
针对非平稳的数字调制信号,构造新的高阶交又累量特征;利用神经网络的学习机制实现自适应模糊推理调制识别器的非线性动态建模;采取分层决策的级联结构,提高了特征与识别器的契合度,最大程度上减少了隶属度函数和模糊规则的冗余;根据特征样本的大致分布建立蕴涵初始经验的级联模糊神经网络系统,使知识推理结构明确可控;通过样本训练实现结构参数自适应调整和优化,完成其逼近求精.仿真实验证明,该系统在信噪比等环境参数变化较大的情况下具有更好的稳健性,其算法识别率和效率相对于神经网络识别器和模糊识别器有明显提高.  相似文献   

13.
基于规则置信度调整的关联文本分类   总被引:1,自引:0,他引:1  
基于关联规则的文本分类方法ARC-BC是目前已知的分类效果最好的关联规则分类算法.本文提出了利用ARC-BC分类器的封闭测试的结果对分类器进行调整规则置信度的算法RCA(Rules Confidence Adjustment),参与正确分类行为次数多于参与错误分类行为次数(即"威信"较高)的规则应该拥有更高的置信度,反之,就赋予更低的置信度.实验结果表明,经过RCA算法调整的关联文本分类器的分类效果得到显著提高.  相似文献   

14.
Building a high accuracy classifier for classification is a problem in real applications. One high accuracy classifier used for this purpose is based on association rules. In the past, some researches showed that classification based on association rules (or class-association rules – CARs) has higher accuracy than that of other rule-based methods such as ILA and C4.5. However, mining CARs consumes more time because it mines a complete rule set. Therefore, improving the execution time for mining CARs is one of the main problems with this method that needs to be solved. In this paper, we propose a new method for mining class-association rule. Firstly, we design a tree structure for the storage frequent itemsets of datasets. Some theorems for pruning nodes and computing information in the tree are developed after that, and then, based on the theorems, we propose an efficient algorithm for mining CARs. Experimental results show that our approach is more efficient than those used previously.  相似文献   

15.
基于短前缀长度分割的高速二维分组分类算法   总被引:1,自引:0,他引:1  
分组分类是路由器根据IP分组的多个域,从分类器数据库中匹配每个输入分组,确定分组转发规则的技术,分类器为实现因特网新业务提供了统一的方式,这些新业务包括:防火墙,网络地址翻译等,二维分组分类问题在未来的因特网体系结构中占有十分重要的地位,目前,人们已经提出了几种分组分类算法,但没有一种是理想的,提出基于短前缀长度分割的二维分组分类算法,它使用短前缀长度分割(SPLS)技术对分类器集合进行分割,使得分割后的小分类器子集合可以使用巳有快速IP路由查找方法进行查找,实现时以多叉树作为基本数据结构,实验显示它具有存储需求小,平均查询时间快,更新时间快,适合于大的分类器等特点,是一种较好的二维分组分类算法。  相似文献   

16.
针对MLKNN算法仅对独立标签进行处理,忽略现实世界中标签之间相关性这一问题,提出了一种基于关联规则的MLKNN多标签分类算法(FP-MLKNN)。该算法采用关联规则算法挖掘标签之间的高阶相关性,并用标签之间的关联规则改进MLKNN算法,以达到提升分类性能的目的。首先,使用MLKNN算法求样本的特征置信度;采用关联规则算法挖掘生成一系列强关联规则,进而将2种算法进行融合来构造多标签分类器,对新标签进行预测;在此基础上,将本文提出的算法与MLKNN、AdaBoostMH和BPMLL这3种算法进行实验对比。实验结果表明,本文所提算法在yeast、emotions和enron数据集上的分类性能均优于这3种算法,具有较好的分类效果。  相似文献   

17.
为提高语义图像分类器性能,提出一种基于公理化模糊集的语义图像层次关联规则分类器。首先,为提高算法精度,在对图像数据集进行特征提取基础上,采用公理化理论(AFS)构建图像集模糊概念的AFS属性表达,提高图像集属性辨识度;其次,为提高算法计算效率,考虑采用层次结构关联规则,构建语义图像分类器,利用概念之间的本体信息,提高并行分类能力;最后,通过对算法参数及横向对比实验,显示所提算法具有较高的计算精度和计算效率。  相似文献   

18.
网络异常行为的检测方法   总被引:1,自引:0,他引:1  
齐建东  陶兰  孙总参 《计算机工程》2004,30(5):104-105,158
提出了基于数据挖掘技术的网络异常检测方案,并给出核心模块的算法实现。首先使用静态关联规则挖掘算法和领域层面挖掘算法刻画系统的网络正常活动简档,然后通过动态关联规则挖掘算法和领域层面挖掘算法输出表征对系统攻击行为的可疑的规则集,这些规则集结合从特征选择模块中提取网络行为特征作为分类器的输入,以进一步降低误报率。在DARAP1998、DARAP1999入侵检测评估数据集上的实验证明了该方法的有效性。  相似文献   

19.
20.
既有的基于数据挖掘技术的入侵检测将研究重点放在误用检测上。提出了基于数据挖掘技术的网络异常检测方案,并详细分析了核心模块的实现。首先使用静态关联规则挖掘算法和领域层面挖掘算法刻画系统的网络正常活动简档,然后通过动态关联规则挖掘算法和领域层面挖掘算法输出表征对系统攻击行为的可疑规则集,这些规则集结合从特征选择模块中提取网络行为特征作为分类器的输入,以进一步降低误报率。在由DAR-AP1998入侵检测评估数据集上的实验证明了该方法的有效性。最后,对数据挖掘技术在入侵检测领域中的既有研究工作做了,总结。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号