首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
本文讨论了一种具有自由度特征的树分类器,该分类器利用其自由度能很好地完成决策树的旋转,使分类器具有回溯功能。  相似文献   

2.
基于贝叶斯网的分类器及其在CRM中的应用   总被引:4,自引:0,他引:4  
基于贝叶斯网的分类器因其对不确定性问题有较强的处理能力,因此在CRM客户建模中有其独特的优势。在对朴素贝叶斯分类器、通用贝叶斯网分类器优缺点分析的基础上,引入增强型BN分类器和贝叶斯多网分类器,详细介绍了后者的算法,并将其应用到实际电信CRM客户.建模中,取得较好的效果。  相似文献   

3.
基于关联规则的贝叶斯网络分类器   总被引:1,自引:0,他引:1  
关联规则分类器(CBA)利用关联规则来构造分类算法,但其没有考虑分类问题中的不确定性.提出一种基于关联规则的贝叶斯网络分类算法.该算法利用关联规则挖掘算法提取初始的候选网络边集,通过贪心算法学习网络结构,得到比经典的贝叶斯网络分类器TAN更好的拓扑结构.通过在15个UCI数据集上的实验结果表明,该算法取得了比TAN,CBA更好的分类性能.  相似文献   

4.
一种基于假设检验的贝叶斯分类器   总被引:1,自引:0,他引:1  
分类是数据挖掘领域的重要分支,而贝叶斯分类方法作为分类领域的重要技术得到了日益广泛的研究和应用。限制性贝叶斯网络在不牺牲太多精确性的前提下简化网络结构,是近几年分类领域的研究热点。论文采用统计学中理论较成熟的体积假设检验(Volume Testing)方法寻找属性间的依赖关系,同时结合假设检验的思想和朴素贝叶斯分类算法的优点构造限制性贝叶斯网络,提出了一种基于假设检验的贝叶斯分类算法,并命名为基于体积检验的贝叶斯分类算法。在Weka系统下进行的实验,结果表明,这种方法效果优于朴素贝叶斯方法、TAN算法等,尤其对大数据集有更佳的表现效果。  相似文献   

5.
一种基于规则的模式分类器设计方法   总被引:1,自引:0,他引:1  
针对复杂场景下的模式分类问题,该文提出了一种基于规则的模式分类器设计方法。其基本思想是:首先运用非参数统计方法建立描述样本特征分布的规则集;然后构造一种链式结构将规则集中的元素组织起来,形成模式分类器;最后在以训练样本识别结果为指导的前提下,优化规则集的制定方法和分类器结构。该设计方法的有效性在某对海监视雷达目标识别实验中得到了验证。  相似文献   

6.
针对二支决策TAN分类器在处理不确定数据时有较高的错误率,提出一种新的三支扩展TAN贝叶斯分类器(3WD-TAN).首先通过构建TAN贝叶斯分类模型,采用先验概率和类条件概率估计三支决策中的条件概率;其次构建3WD-TAN分类器,制定3WD-TAN分类器中正域,负域和边界域的三支分类规则,结合边界域处理不确定性数据的优...  相似文献   

7.
AdaBoost是机器学习中比较流行的分类算法.通过研究弱分类器的特性,提出了两种新的弱分类器的阈值和偏置计算方法,二者可以使弱分类器识别率大于50%,从而保证在弱分类器达到一定数目的情况下,AdaBoost训练收敛.对两种阈值和偏置计算方法的仿真实验结果表明,在错分率降可接受的范围内,二者均使用较少的弱分类器便可获得高识别率的强分类器.  相似文献   

8.
文中研究贝叶斯分类器家族中的一种扩展朴素贝叶斯分类器。此种扩展朴素贝叶斯分类器满足两个条件:一是类结点是所有属性的父结点;二是每个属性最多有一个属性父结点。其中有代表性的两种算法是贪婪爬山算法(Hill Climbing Search,即HCS算法)和超父结点算法(Superparent,即SP算法)。对两种算法进行了分析和比较,并在此基础上提出了一种改进算法。通过实验验证所改进的分类器是正确的、有效的。  相似文献   

9.
决策树、朴素贝叶斯和朴素贝叶斯树的比较   总被引:1,自引:1,他引:0  
利用数据挖掘工具Weka,在常态数据集adult上进行实验,从时间、正确率、误差率三个指标对比分析J48(C4.5决策树),朴素贝叶斯分类器,朴素贝叶斯树(NBTree)三种分类算法.结论为:在内存充足,时间要求不高的情况下,使用朴素贝叶斯树(NBTree)能获得更高的正确率和错误率;J48则是一种折中的方案;朴素贝叶斯分类器完成时间最短,但正确率和错误率为三种算法中最差.  相似文献   

10.
文中研究贝叶斯分类器家族中的一种扩展朴素贝叶斯分类器。此种扩展朴素贝叶斯分类器满足两个条件:一是类结点是所有属性的父结点;二是每个属性最多有一个属性父结点。其中有代表性的两种算法是贪婪爬山算法(Hill Climb-ing Search,即HCS算法)和超父结点算法(Superparent,即SP算法)。对两种算法进行了分析和比较,并在此基础上提出了一种改进算法。通过实验验证所改进的分类器是正确的、有效的。  相似文献   

11.
一个自生成的神经树网络模式分类器   总被引:1,自引:0,他引:1  
本文研究一种神经树网络(NTN,NeuralTreeNetwork)模型,提出一种能自动生成其体系结构的有监督的竞争学习算法,指出该模型能解决复杂的多类模式分类问题.模拟数字例子——手写体数码识别的结果也表明该分类器是有效的.  相似文献   

12.
在管理信息系统的层次分类树中,为了快速查询分类信息并高效地生成层次分类子树,提出了一种基于前缀编码的先根遍历树生成算法。该算法中的节点采用前缀编码的数据结构,便于快速检索出子树节点集合;在构造子树时预先对其进行先根遍历,产生有序遍历表,同时记录最近各层节点的信息,使得建立子树的效率得到大幅提高。最后通过实例验证了所提算法的有效性,为管理信息系统中层次分类树的建立提供了可行的解决途径。  相似文献   

13.
决策树方法在气温预测中的应用   总被引:1,自引:0,他引:1  
结合陕北某县30年的气象数据,利用决策树的CART分类方法,建立预测气温的决策树模型,为提高预测的正确率还尝试了分季节的温度预测模型。通过反复试验得到各个季节的最佳气温预测模型,为气象预测研究提供了一种参考方法。  相似文献   

14.
近年来,由大学生心理疾病引发的各种社会问题频发,把数据挖掘技术引入大学生心理健康状况的诊断研究具有其他技术不可比拟的优势,它能挖掘事物中隐含的规律。对决策树C4.5算法的原理进行阐述,并通过C4.5建立一个心理健康评估模型,构造决策树,由提取规则对心理健康进行预测。实验结果表明,该算法能将学生心理健康进行正确分类。挖掘结果能指导心理健康教育工作者制定正确的辅导计划,对辅助决策有很好的帮助。  相似文献   

15.
一种新的人工免疫系统检测规则及其应用   总被引:2,自引:0,他引:2  
为了提高检测器集的生成效率,在讨论人工免疫系统负选择模型的基础上,提出一种新的检测规则,即:编辑距离规则.在这种规则中,对于一个随机生成的字符串和Self集中的字符串,采用编辑距离度量它们之间的相似性.随后,利用这种检测规则给出一种新的检测器集生成算法,它要求利用Trie数据结构组织和存储Self集.最后,通过理论分析得出了使用该种算法的优越性.  相似文献   

16.
随着网络犯罪的日益猖獗,计算机取证正逐步成为人们研究与关注的焦点.为了能从海量的可疑数据中发现证据,数据挖掘技术的参与必不可少.首先介绍了在计算机取证中比较常用的数据挖掘分类分析方法,然后介绍其在计算机取证原型系统中的实现和应用,最后给出了进一步研究的方向:多样证据的提取及其之间的关联.  相似文献   

17.
由神经网络提取规则的一种方法及其应用   总被引:10,自引:1,他引:9  
提出一种由预处理和规则提取两阶段组成的方法从神经网络中提取规则,预处理阶段包含有动态修正、聚类和删枝3部分。动态修正是自动生成或由初始规则集构造出全联接或非全联接网络初步拓扑结构;聚类和删枝分别删截掉不重要或多余的隐含节点和联接,从而可以得到最简洁和规模小的拓扑结构,成为提取规则的基础,提出了规则提取算法并用于已删截好的网络提取规则。该方法应用于美国AD报告中气象云图的数据,提取出规则集,经过测试  相似文献   

18.
一种新的基于属性—值对的决策树归纳算法   总被引:5,自引:1,他引:5  
决策树归纳算法ID3是实例学习中具有代表性的学习方法。文中针对ID3易偏向于值数较多属性的缺陷,提出一种新的基于属性-值对的决策树归纳算法AVPI,它所产生的决策树大小及测试速度均优于ID3。该算法应用于色彩匹配系统,取得了较好效果。  相似文献   

19.
This article presents a methodology based on the mixture model to classify the real biomedical time series. The mixture model is shown to be an efficient probabilistic density estimation scheme aimed at approximating the posterior probability distribution of a certain class of data. The approximation is conducted by employing a weighted mixture of a finite number of Gaussian kernels whose parameters and mixing coefficients are estimated iteratively through a maximum likelihood method. A database of the real electrocardiogram (ECG) time series of out-of-hospital cardiac arrest patients suffering ventricular fibrillation (VF) with known defibrillation outcomes was adopted to evaluate the performance of this model and confirm its efficiency compared with other classification methods.  相似文献   

20.
This paper proposes a classification framework based on simple classifiers organized in a tree‐like structure. It is observed that simple classifiers, even though they have high error rate, find similarities among classes in the problem domain. The authors propose to trade on this property by recognizing classes that are mistaken and constructing overlapping subproblems. The subproblems are then solved by other classifiers, which can be very simple, giving as a result a hierarchical classifier (HC). It is shown that HC, together with the proposed training algorithm and evaluation methods, performs well as a classification framework. It is also proven that such constructs give better accuracy than the root classifier it is built upon.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号