首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
分类是数据挖掘和模式识别中的一个基本和重要的课题。文中讨论了基于贝叶斯学习的TAN分类器的基本概念和分类算法,同时将分类器算法和具体分类算法结合为一个完整的有效算法。用某高校人才识别系统这一实例来说明TAN分类器的推理过程,并介绍了TAN分类器在数据挖掘领域的应用。实验结果表明TAN分类器具有较好的分类性能和较高的分类精度。  相似文献   

2.
朴素贝叶斯分类器是一种简单且有效实现的文本自动类方法,但其独立性假设在实际中是不存在的。在TAN结构贝叶斯分类算法中,考虑了两两属性间的关联性,对属性间的独立性假设有了一定程度的降低。  相似文献   

3.
针对二支决策TAN分类器在处理不确定数据时有较高的错误率,提出一种新的三支扩展TAN贝叶斯分类器(3WD-TAN).首先通过构建TAN贝叶斯分类模型,采用先验概率和类条件概率估计三支决策中的条件概率;其次构建3WD-TAN分类器,制定3WD-TAN分类器中正域,负域和边界域的三支分类规则,结合边界域处理不确定性数据的优...  相似文献   

4.
现代社会网络招聘兴起,为社会、企业节省了不少物力、人力、财力,但如何快速、简捷地从众多的电子简历中找出符合要求的简历又是一个让人头疼的问题.文中在贝叶斯网络的基础上,分别从朴素贝叶斯分类器和 TAN 分类器角度,构建一个基于贝叶斯分类器的电子简历筛选模型,并通过实验验证该模型对电子简历进行分类时的准确率和查全率,且引入一个新的评价指标 f 同时考虑准确率和查全率,得出没有属性变量相互独立限制的 TAN 分类器具有较好的分类效果的结论.  相似文献   

5.
基于贝叶斯网络理论的TAN分类器无向依赖扩展   总被引:3,自引:0,他引:3  
基于贝叶斯网络理论,对TAN分类器进行无向网络依赖扩展,把属性变量之问的树结构扩展成可分解马尔科夫网络.使经过依赖扩展得到的分类器能够充分利用属性变量之间的依赖信息,提高分类能力,并能够通过调节阚值大小避免过度拟舍.  相似文献   

6.
针对目前交通灯智能化程度低,容易造成交通拥堵的问题,提出一种基于TAN分类器的交通灯时间智能动态估计方法。首先,分析影响交通灯时间的主要因素,并对采集到的数据用模糊分类函数进行离散化处理;其次,依据K2算法学习TAN分类器结构;接着,使用最大似然估计法学习TAN分类器的参数;最后,通过基于时间窗的前向后向算法在线估计出最佳交通灯时间。仿真实验结果表明:本文提出的方法能够根据实时交通路况信息动态估计出最佳交通灯时间,当路口畅通时,交通灯时间短;反之,交通灯时间长。对有效缓解交通拥堵,减少环境污染有着重要的现实意义。  相似文献   

7.
TAN分类器以良好的分类性能而著称,但分类器本身和归纳学习算法并不具有处理丢失数据的能力,而现有的用于分类技术中丢失数据处理的方法在可靠性方面均不同程度地存在一些缺陷.本文针对问题,结合TAN结构和Gibbs sampling进行具有丢失数据的分类器迭代学习,在迭代中,TAN结构学习、参数学习和丢失数据修复交替进行,随着迭代的收敛,最终将得到TAN分类器,同时丢失的数据也得到修复.  相似文献   

8.
大学生的外语教学一直是大学教学的重要组成部分,而如何更好地有针对性地改进大学外语教学一直是研究的重点。针对以上问题,对学生的行为进行了调查,进而在调查的基础上应用TAN分类器对学生的行为模式进行了分类,并对分类的结果进行了分析。  相似文献   

9.
树增强朴素贝叶斯(TAN)分类器在模型的复杂性和分类精度之间实现较好折衷,成为当前分类器学习的一个研究热点.为了提高TAN分类器的分类准确率,本文提出一种基于KL距离的TAN分类器判别性学习方法.首先用EAR方法学习TAN分类器的结构,然后用基于KL距离的目标函数优化TAN的参数.在标准数据集上的实验结果表明,用该方法学习的TAN分类器具有较高的分类精度.  相似文献   

10.
基于TAN贝叶斯网络分类器的测井岩性预测   总被引:3,自引:0,他引:3  
贝叶斯网络是一种建立在概率和统计理论基础上的数据分析和辅助决策工具,利用其构造出的树扩展朴素贝叶斯网络分类器是目前最优秀的分类器之一。针对石油勘探中测井数据的特殊性,利用贝叶斯网络预测出其对应的岩性,并介绍了使用此方法进行岩性预测的算法过程。通过BNT软件包用Matlab语言构建了分类器,并由实验结果的分析说明了此分类器的优点。  相似文献   

11.
数据挖掘在邮件检测中的应用   总被引:1,自引:0,他引:1  
随着Internet技术的发展,网络中广泛使用的电子邮件正成为一种快捷而经济的通信手段。然而,各种垃圾邮件、邮件炸弹及邮件病毒的出现给用户收发邮件带来了极大的困扰。本文由浅入深地介绍了数据挖掘在邮件检测中的应用,提出了一种基于数据挖掘的检测模型和检测方法。  相似文献   

12.
随着Internet技术的发展,网络中广泛使用的电子邮件正成为一种快捷而经济的通信手段。然而,各种垃圾邮件、邮件炸弹及邮件病毒的出现给用户收发邮件带来了极大的困扰。本文由浅入深地介绍了数据挖掘在邮件检测中的应用。提出了一种基于数据挖掘的检测模型和检测方法。  相似文献   

13.
基于Boosting的TAN组合分类器   总被引:8,自引:1,他引:8  
Boosting是一种有效的分类器组合方法,它能够提高不稳定学习算法的分类性能,但对稳定的学习算法效果不明显,TAN(tree-augmented naive Bayes)是一种树状结构的贝叶斯网络,标准的TAN学习算法生成的TAN分类器是稳定的,用Boosting难以提高其分类性能,提出一种构造TAN的新算法GTAN,并将由GTAN生成的多个TAN分类器用组合方法Boosting-MultiTAN组合,最后实验比较了TAN组合分类器与标准的TAN分类器.实验结果表明,在大多数实验数据上,Boosting-MultiTAN分类器显示出较高的分类正确率。  相似文献   

14.
针对不平衡噪声数据流的分类问题,本文利用基于平均概率的集成分类器AP与抽样技术,提出了一种处理不平衡噪声数据流的集成分类器(IMDAP)模型。实验结果表明,该集成分类器更能适应存在概念漂移与噪声的不平衡数据流挖掘分类,其整体分类性能优于AP集成分类器模型,能明显提升少数类的分类精度,并且具有与AP相近的时间复杂度。  相似文献   

15.
用于数据采掘的贝叶斯分类器研究   总被引:28,自引:0,他引:28  
所谓分类器是一个函数f(x),它给需要分类的实例x赋予类标签c,∈C(j=1,2,…,m),实例x由一组属性值a_1,…,a_n描述,C是类变量,取有限个值,可看成有限个元素的集合。进行分类首先要构造一个分类器。从预先分类的实例进行有导师学习并建立分类器,是机器学习的中心问题之一。已有的分类器如决策树、决策表、神经网络、决策图和规则等,都可以看成不同  相似文献   

16.
针对传统的基于传输层端口和基于特征码的流量分类技术准确率低、应用范围有限等缺点,提出了使用树扩展的贝叶斯分类器的方法,该方法利用网络流量的统计属性和基于统计理论的贝叶斯方法构建分类模型,并利用该模型对未知流量进行分类。实验分析了不同权值、不同规模的数据集对其性能的影响,并与NB、C4.5算法做了比较。实验结果表明,该方法具有较好的分类性能和较高的分类准确率。  相似文献   

17.
基于贝叶斯网的分类器及其在CRM中的应用   总被引:4,自引:0,他引:4  
基于贝叶斯网的分类器因其对不确定性问题有较强的处理能力,因此在CRM客户建模中有其独特的优势。在对朴素贝叶斯分类器、通用贝叶斯网分类器优缺点分析的基础上,引入增强型BN分类器和贝叶斯多网分类器,详细介绍了后者的算法,并将其应用到实际电信CRM客户.建模中,取得较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号