首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 93 毫秒
1.
分类技术在心电图自动诊断模型中的应用比较   总被引:2,自引:0,他引:2  
吴萍  黄勇 《计算机应用》2003,23(11):63-65,105
提高心电图诊断的有效性和准确性的关键在于心电图分类的质量。文中针对这一情况,详细论述了利用各种分类技术对提取的心电图特征数据进行分类的方法,并在比较各种分类算法的基础上,提出了一种基于CBR的心电图自动诊断系统的结构模型。  相似文献   

2.
数据挖掘中分类算法的研究及其应用   总被引:13,自引:1,他引:13  
罗海蛟  刘显 《微机发展》2003,13(Z2):48-50
分类算法是数据挖掘中的最重要的技术之一.作者对具有代表性的分类算法进行了分析和比较;并应用分类方法在居民出行数据中挖掘出一些公交乘客规则,讨论了数据挖掘方法在公交乘客预测中应用的前景和实效.  相似文献   

3.
对分类算法的描述通常缺少定量的分析与研究,本文以K-近邻、支持向量机和决策树为研究对象,定量分析算法参数、数据噪音、节点数量对分类精度和运行时间的影响。首先研究这几种算法及参数作用,选定最优参数,分析不同噪音对分类精度的影响,然后分析节点数量对分类精度影响及运行时间变化。通过Scikit-learn模块对讨论内容进行仿真实验,实验结果清楚地展示了分类算法在不同参数条件下分类特点,为实际数据分类研究提供指导。  相似文献   

4.
Bauer  Eric  Kohavi  Ron 《Machine Learning》1999,36(1-2):105-139
Methods for voting classification algorithms, such as Bagging and AdaBoost, have been shown to be very successful in improving the accuracy of certain classifiers for artificial and real-world datasets. We review these algorithms and describe a large empirical study comparing several variants in conjunction with a decision tree inducer (three variants) and a Naive-Bayes inducer. The purpose of the study is to improve our understanding of why and when these algorithms, which use perturbation, reweighting, and combination techniques, affect classification error. We provide a bias and variance decomposition of the error to show how different methods and variants influence these two terms. This allowed us to determine that Bagging reduced variance of unstable methods, while boosting methods (AdaBoost and Arc-x4) reduced both the bias and variance of unstable methods but increased the variance for Naive-Bayes, which was very stable. We observed that Arc-x4 behaves differently than AdaBoost if reweighting is used instead of resampling, indicating a fundamental difference. Voting variants, some of which are introduced in this paper, include: pruning versus no pruning, use of probabilistic estimates, weight perturbations (Wagging), and backfitting of data. We found that Bagging improves when probabilistic estimates in conjunction with no-pruning are used, as well as when the data was backfit. We measure tree sizes and show an interesting positive correlation between the increase in the average tree size in AdaBoost trials and its success in reducing the error. We compare the mean-squared error of voting methods to non-voting methods and show that the voting methods lead to large and significant reductions in the mean-squared errors. Practical problems that arise in implementing boosting algorithms are explored, including numerical instabilities and underflows. We use scatterplots that graphically show how AdaBoost reweights instances, emphasizing not only hard areas but also outliers and noise.  相似文献   

5.
口语理解是实现口语对话系统的关键技术之一.它主要面临两方面的挑战:1)稳健性,因为输入语句往往是病态的;2)可移植性,即口语理解单元应能够快速移植到新的领域和语言.提出了一种新的基于两阶段分类的口语理解方法:第1阶段为主题分类,用来识别用户输入语句的主题;第2阶段为主题相关的语义槽分类,根据识别的主题抽取相应的语义槽值对.该方法能对用户输入语句进行深层理解,同时也能保持稳健性.它基本上是数据驱动的,而且训练数据的标记也比较容易,可方便地移植到新的领域和语言.实验分别在汉语交通查询领域和英语DARPA Communicator领域进行,结果表明了该方法的有效性.  相似文献   

6.
口语理解是实现口语对话系统的关键技术之一.它主要面临两方面的挑战:1)稳健性,因为输入语句往往是病态的;2)可移植性,即口语理解单元应能够快速移植到新的领域和语言.提出了一种新的基于两阶段分类的口语理解方法:第1阶段为主题分类,用来识别用户输入语句的主题;第2阶段为主题相关的语义槽分类,根据识别的主题抽取相应的语义槽/值对.该方法能对用户输入语句进行深层理解,同时也能保持稳健性.它基本上是数据驱动的,而且训练数据的标记也比较容易,可方便地移植到新的领域和语言.实验分别在汉语交通查询领域和英语DARPA Communicator领域进行,结果表明了该方法的有效性.  相似文献   

7.
运动相关电位(MRPs)机理复杂、形式多变,使得对基于MRPs的脑电信号的特征提取和数据挖掘工作很具有挑战性。本文目的是要将多种机器学习和语义范式模型应用于对脑电信号的数据挖掘,以应对上述挑战。本文采用多种机器学习算法和信号处理方法进行分析和实验对比,并给出对应不同场景、目标的最佳模型。为了将跨度较大的模糊性的电生理信号、兼容多种信号的深度学习和明确的语义模型各领域无缝地衔接,实现了一个以脑电信号数据为研究对象的语义范式框架,赋予复杂信号以文法、语法和语义内涵,为深度神经网络构筑了语义解释。通过该范式框架能够找出脑电信号中特定语义的信息块以及这些信息块之间的语义组合,自动学习出高效的滤波器,达到准确率高、传输通量大、普适性强的效果。  相似文献   

8.
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样本来构建代价敏感分类的决策树基分类器,然后通过投票的方式集成后进行软件模块的缺陷预测,并给出模型构建过程中代价因子最优值的判定选择方法。使用公开的NASA软件缺陷预测数据集进行仿真实验,结果表明该方法在保证缺陷预测率的前提下,误报率明显降低,综合评价指标AUC和F值均优于现有方法。  相似文献   

9.
基于C4.5决策树的流量分类方法   总被引:17,自引:1,他引:17  
徐鹏  林森 《软件学报》2009,20(10):2692-2704
近年来,利用机器学习方法处理流量分类问题成为网络测量领域一个新兴的研究方向.在现有研究中,朴素贝叶斯方法及其改进算法以其实现简单、分类高效的特点而被广泛应用.但此类方法过分依赖于样本在样本空间的分布,具有潜在的不稳定性.为此,引入C4.5决策树方法来处理流量分类问题.该方法利用训练数据集中的信息熵来构建分类模型,并通过对分类模型的简单查找来完成未知网络流样本的分类.理论分析和实验结果都表明,利用C4.5决策树来处理流量分类问题在分类稳定性上均具有明显的优势.  相似文献   

10.
一种新的基于遗传算法的数据分类方法   总被引:5,自引:0,他引:5  
当前分类算法还存在诸如伸缩性不强、可调性差、缺乏全局优化能力等问题.通过构造完全分类规则集,设计了一种有效的遗传编码方法,使得遗传算法的各种优良特性在数据分类中得到充分的运用,从而提出了一种新的数据分类算法,新算法有效提高了数据分类的准确性,较好克服了当前存在的缺点.最后,给出了实验结果,证实了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号