共查询到20条相似文献,搜索用时 15 毫秒
1.
针对当前分类算法还存在的诸如伸缩性不强、可调性差、缺乏全局优化能力等问题,该文提出了一种有效的用于数据挖掘分类任务的方法——基于决策树的协同进化分类算法。实验结果表明该方法获得了更高的预测准确率,产生了更小的规则集。 相似文献
2.
针对当前分类算法还存在的诸如伸缩性不强、可调性差、缺乏全局优化能力等问题,该文提出了一种有效的用于数据挖掘分类任务的方法--基于决策树的协同进化分类算法.实验结果表明该方法获得了更高的预测准确率,产生了更小的规则集. 相似文献
3.
基于决策树规则的分类算法研究 总被引:1,自引:0,他引:1
在商业利益的驱动下,人们不断地深入研究决策树算法.为了提高分类的精度,提出了一种基于决策树规则的分类算法.通过C4.5决策树算法得出决策规则,计算决策规则的长度,准确率与覆盖率,对所得的决策规则依次按照规则长度与准确率的乘积大小、长度的大小、覆盖率的大小对规则集进行排序构造分类器,选择优选权最高的规则进行匹配分类.实验结果表明,与C4.5算法相比,该方法的分类精度有所提高. 相似文献
4.
为了提高决策树分类的速度和精确率,提出了一种基于分类矩阵的决策树算法.介绍了ID3算法的理论基础,定义了一种分类矩阵,指出了ID3算法的取值偏向性并利用分类矩阵给出了证明.在此基础上,引入了一个权重因子,抑制了原有算法的取值偏向,并利用分类矩阵给出相应证明,同时根据基于分类矩阵增益的特点,提出了新的决策树分类方案,旨在运算速率上进行优化,与原有算法进行了实验比较.对实验结果分析表明,优化后的方案在性能上有明显改善. 相似文献
5.
6.
7.
8.
9.
针对蛋白质序列分类的需求,深入研究了蛋白质序列分类算法。对蛋白质序列的特征属性进行了大量的分析和研究,给出了蛋白质序列特征属性的描述形式。在此基础上设计了一种基于加权决策树的蛋白质序列分类算法,详细阐述了加权决策树的构造过程以及决策树的主要参数计算方法,而且根据蛋白质序列的特征,对决策树进行了改进,给出了加权决策树的实现方法。测试结果表明:设计的蛋白质序列分类算法具有较高的分类精度和较快的执行速度。 相似文献
10.
针对现有分类器对遥感影像分类结果存不准确的问题,本文提出了一种基于决策树分类器的遥感影像分类方法,该方法以复合决策树Boost Tree思想为基础,首先利用分形理论中的毯模型提取遥感影像的纹理特征,根据遥感影像分类的特点,构造新的单棵决策树生成算法对遥感影像进行分类。以北京市五环内区域为研究区,使用landsat7 ETM数据源,实现了基于分形纹理特征、光谱特征的改进决策树分类。实验结果表明:通过毯模型提取的纹理特征可以很好地表达表面特征,辅以该纹理信息的改进决策树分类精度相比于只用光谱信息进行分类的精度有一定的提高,改善了分类效果。 相似文献
11.
12.
C4.5算法是用于生成决策树的一种经典算法,虽然其有很强的噪声处理能力,但当属性值缺失率高时,分类准确率会明显下降,而且该算法在构建决策树时,需要多次扫描、排序数据集、以及频繁调用对数,针对以上缺点,本文提出一种改进的分类算法.采用一种基于朴素贝叶斯定理方法,来处理空缺属性值,提高分类准确率.通过优化精简计算公式,在计算过程中,改进后的计算公式使用四则混合运算代替原来的对数运算,减少构建决策树的运行时间.为了验证该算法的性能,通过对UCI数据库中5个数据集进行实验,实验结果表明,改进后的算法极大的提高了运行效率. 相似文献
13.
基于SPRINT方法的并行决策树分类研究 总被引:9,自引:0,他引:9
决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和研究,并提出了进一步研究的方向。 相似文献
14.
15.
常规线上教学资源分类管理系统使用Executor执行器分配教学资源,易受执行器输入输出接口参数影响,导致分类管理系统的运行状态与预期不符,因此基于决策树算法设计了一种全新的线上教学资源分类管理系统。硬件部分设计了Intel Sandy bridge多核处理器及型号专用寄存器(Model Specific Register,MSR),软件部分基于策树分类节点计算了GiniIndex属性值,生成了教学资源属性分类选择策略,从而完成了线上教学资源分类管理。系统测试结果表明,基于决策树算法的线上教学资源分类管理系统的运行状态与预期相符,整体运行性能良好,符合线上教学资源的分类管理需求,有一定的应用价值,为教学资源的数字化管理作出了一定的贡献。 相似文献
16.
基于决策分类熵的决策树构造算法及应用 总被引:1,自引:0,他引:1
为了更好地完成金融数据集上的分类挖掘任务,以粗糙集理论为基础提出决策分类熵的概念,进而以属性的决策分类熵为属性分裂度量提出基于决策分类熵的决策树构造算法,并针对过拟合问题提出一种抑制参数来实现树规模的良好控制。实例分析及金融数据集上的实验表明:相比经典的C4.5决策树算法,新算法能够较好地克服其缺点和不足,构建更优的决策树,能够更好地完成分类任务。 相似文献
17.
本文将粗糙集理论应用到决策树生成过程中,利用变精度粗糙集理论属性约简的特性在决策树生成过程中在保证分类能力不变的前提下减少分支数目,并考虑到实际问题中噪声数据的影响。 相似文献
18.
19.
线上思政教学资源量较为庞大,学生难以从大量数据中找到所需的数据,降低了思政教学资源的利用率,因此提出了基于决策树算法的线上思政教学资源分类方法。该方法利用互信息方法提取线上思政教学资源的特征,采用决策树算法构建决策树分类器,将提取的思政教学资源特征输入分类器完成资源的分类。最后,与传统的分类方法进行对比实验。实验结果表明,所提出的分类方法在分类精度与运行时间上优于传统分类方法,能够合理分类线上思政教学资源,可应用于实际的教学资源分类储存。 相似文献