首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
决策树在客户价值分析中的应用   总被引:1,自引:0,他引:1  
决策树算法是数据挖掘的一个活跃的研究领域。文中介绍了一种决策树的构建方法及其步骤。在训练样本的基础上,通过不断的计算选择比较合适的属性作为树根、子树根,并且不断重复,基于前向剪枝方法,最终建立了经过优化的决策树。经过Weka系统验证后,决策树和建立的相应规则性能良好。最后将决策树应用于客户价值分析中,并得到了一定的实用价值。  相似文献   

2.
决策树在客户价值分析中的应用   总被引:1,自引:0,他引:1  
决策树算法是数据挖掘的一个活跃的研究领域。文中介绍了一种决策树的构建方法及其步骤。在训练样本的基础上,通过不断的计算选择比较合适的属性作为树根、子树根.并且不断重复,基于前向剪枝方法,最终建立了经过优化的决策树。经过Weka系统验证后,决策树和建立的相应规则性能良好。最后将决策树应用于客户价值分析中,并得到了一定的实用价值。  相似文献   

3.
代价敏感决策树是以最小化误分类代价和测试代价为目标的一种决策树.目前,随着数据量急剧增长,劣质数据的出现也愈发频繁.在建立代价敏感决策树时,训练数据集中的劣质数据会对分裂属性的选择和决策树结点的划分造成一定的影响.因此在进行分类任务前,需要提前对数据进行劣质数据清洗.然而在实际应用中,由于数据清洗工作所需要的时间和金钱代价往往很高,许多用户给出了自己可接受的数据清洗代价最大值,并要求将数据清洗的代价控制在这一阈值内.因此除了误分类代价和测试代价以外,劣质数据的清洗代价也是代价敏感决策树建立过程中的一个重要因素.然而,现有代价敏感决策树建立的相关研究没有考虑数据质量问题.为了弥补这一空缺,着眼于研究劣质数据上代价敏感决策树的建立问题.针对该问题,提出了3种融合数据清洗算法的代价敏感决策树建立方法,并通过实验证明了所提出方法的有效性.  相似文献   

4.
决策树是数据挖掘中的一种重要的分类器.文章在介绍了一些典型的决策树分类算法的基础上,研究了一种相关性度量的决策树分类器.其主要思想是在建立决策树过程中采用属性相关性度量来确定划分条件属性的顺序,通过阈值设定和处理简化了决策树的剪枝和优化过程,避免了使用信息熵带来的不当划分,详细描述了算法的执行过程以及正确性证明和时间复杂性分析.  相似文献   

5.
基于代表性数据的决策树集成*   总被引:1,自引:1,他引:0  
为了获得更好的决策树集成效果,在理论分析的基础上从数据的角度提出了一种基于代表性数据的决策树集成方法。该方法使用围绕中心点的划分(PAM)算法从原始训练集中提取出代表性训练集,由该代表性训练集来训练出多个决策树分类器,并由此建立决策树集成模型。该方法能选取尽可能少的代表性数据来训练出尽可能好的决策树集成模型。实验结果表明,该方法使用更少的代表性数据能获得比Bagging和Boosting还要高的决策树集成精度。  相似文献   

6.
懒惰式决策树分类是一种非常有效的分类方法。它从概念上为每一个测试实例建立一棵“最优”的决策树。但是,大多数的研究是基于小的数据集合之上。在大的数据集合上,它的分类速度慢、内存消耗大、易被噪声误导等缺点,影响了其分类性能。通过分析懒惰式决策树和普通决策树的分类原则,提出了一种新的决策树分类模型,Semi—LDtree。它生成的决策树的节点,如普通决策树一样,包含单变量分裂,但是叶子节点相当于一个懒惰式决策树分类器。这种分类模型保留了普通决策树良好的可解释性,实验结果表明它提高了分类速度和分类精确度,在某些分类任务上它的分类性能经常性地胜过两者,特别是在大的数据集合上。  相似文献   

7.
左思强  冯少荣 《福建电脑》2011,27(4):140-142
决策树C5分类算法是一种广泛应用的分类方法,本文根据泉州初中某届学生3年数学成绩建立c5决策树,并对生成的决策树进行合理的分析。从而指导教师在恰当的时期有针对性对学生进行辅导以提高中考及格率和优秀率.并为以后更详细的教学成果数据分析奠定了基础。  相似文献   

8.
决策树是一种重要的数据分类方法,在构造决策树的过程中,测试属性的选择直接影响到决策树中结点的个数和深度,基于相对熵的概念提出了一种新的决策树构造方法。实例分析的结果表明:在决策树的构造上,粗糙集理论中相对熵的方法计算量较小,构造的决策树比经典ID3,C4.5算法简洁,并且具有较高的分类精度。  相似文献   

9.
决策树C4.5算法在天然气输差分析中的应用   总被引:4,自引:0,他引:4  
分类器是数据挖掘的一种基本方法。文章首先介绍了分类器的基本概念和决策树构建思路,然后讲述了在天然气信息数据库的基础上如何建立决策树分类器(用Java语言)和寻找影响输差较大的因素,从而得出一些实用的预测输差的规则。  相似文献   

10.
模糊决策树算法与清晰决策树算法的比较研究   总被引:10,自引:2,他引:10  
ID3算法是一种典型的决策树归纳算法,这种算法在假定示例的属性值和分类值是确定的前提下,使用信息熵作为启发式建立一棵清晰的决策树。针对现实世界中存在的不确定性,人们提出了另一种决策树归纳算法,即模糊决策树算法,它是清晰决策树算法的一种推广。这两种算法在实际应用中各有自己的优劣之处,针对一个具体问题的知识获取过程,选取哪一种算法目前还没有一个较明确的依据。该文从5个方面对这两种算法进行了详细的比较,指出了属性为连续值时这两种算法的异同及优缺点,其目的是在为解决具体问题时怎样选择这两种算法提供一些有用的线索。  相似文献   

11.
针对混合流水车间调度问题(HFSP),本文提出了一种新的基于果蝇算法和变邻域搜索的混合优化方法.首先,将关键块内的工序与同阶段其他机器上的工序进行交换,提出了一种基于关键路径的HFSP新邻域结构.其次,针对HFSP的阶段式解码特性,提出了一种邻域解的快速评估方法,并验证了快速评估方法的高效性.然后,基于提出的新邻域结构,并将N7和K-insertion邻域结构引入HFSP,设计了基于上述3种邻域结构的变邻域搜索方法,以此为基础提出了一种针对HFSP的混合优化方法.最后,通过对Carlier和Liao等经典测试集进行测试,验证了所提新邻域结构的可行性和有效性,并将该方法与其他文献的方法进行了对比,验证了所提方法的优越性.  相似文献   

12.
在无人机应用于输电线巡检背景下,为了方便后续的输电线故障检测与分析,提出了一种两点间直线搜索的输电线检测方法。首先,通过方向可控滤波器对无人机图像进行分割。然后,通过所提出的基于圆搜索(CBS)直线段检测方法进行直线段检测。最后,通过所提出的连接算法进行直线段连接。通过在人造图像上的直线段检测实验,证明该方法是一种有效的直线检测方法。随后,通过在实际场景的无人机图像上进行实验,证明该方法是一种有效的输电线检测方法。  相似文献   

13.
针对传统的基于多图谱的医学图像分割过程中的相似度加权融合的方法没有考虑图谱集的干扰性和冗余性的不足, 提出一种基于两步图谱选择策略的脑MR图像分割方法. 该方法首先采用一种基于最小角回归的方法进行图谱粗选择, 其次则采用基于豪斯多夫距离的以目标为导向的图谱精选择. 粗选择方法可以在总体上来寻找和目标图像较为相似的图谱,...  相似文献   

14.
本文针对移动机器人的全区域遍历问题提出了一种基于栅格法的单元遍历分解方法.本文在普通单元分解法的基础上提出了一种改进的基于边沿基点的单元分解方式,保证了单元遍历的有序性和较强的可实现性.单元内部采用栅格法进行遍历,按照优先级搜索栅格有效地提高了路径选择速率.与单纯采用栅格法相比,栅格法同单元分解法的结合运用既能降低移动机器人在栅格定位过程中存在的累积误差,又保证了遍历的高效率和低重复率.文中对提出的遍历方法进行了动画仿真,从理论上验证了该方法的有效性.最后文章针对提出的遍历方法探讨了其实验平台的设计思路.  相似文献   

15.
A mathematical programming method is proposed for determining the complete history of (generalized) stresses and strains during a loading process for a class of elastic-plastic structures. This method is based on a pivoting procedure similar to the simplex method for a linear program and is suited for computer implementation. The method is illustrated by a simple truss problem. Based on the method, some results on existence and uniqueness of the solution of the structural problem are established.  相似文献   

16.
The reverse Polish notation (RPN) is a well-known method for the expression notification in a postfix manner, instead of using the usual infix notation. Authors made a method for symbolic computation based on RPN. This method is successfully applied on a number of problems. In this article, there is a brief survey of these applications. In addition, the application of the method on algebraic computation of unary pairfunctions is presented.  相似文献   

17.
在无人机应用于输电线巡检背景下,为了方便后续的输电线故障检测与分析,提出一种新的基于无人机图像的输电线检测方法.首先,通过Otsu获取高低阈值的方法改进Canny边缘检测算法,用于提取输电线图像边缘;然后,通过数学形态学方法处理边缘检测得到的二值图像,并用分式查表法改进的Hough变换对数学形态学处理后的图像进行直线段检测;最后,提出线-线空间信息分析的方法,对检测出来的直线段进行筛选和拟合.通过在无人机图像上的实验结果表明,本文提出的输电线检测方法是一种性能良好的基于无人机图像的输电线检测方法.  相似文献   

18.
This paper presents a novel method to detect when a vehicle is changing lanes by considering individual driving styles. Some previous works have focused on the relation between lane changes and driving styles; however, the detection method of lane changes while considering driving styles is still not reported. The proposed method extracts a new feature to appropriately describe driving styles based on drivers' risk taking behavior when following the preceding vehicle. Based on the driving style of the target vehicle, performing a lane change is estimated at each time step. The determined driving style is used as input for the lane-change detection method based on the gap acceptance model, and it is integrated with the detection method based on vehicle movements. Experiments are used to demonstrate that the proposed method considerably improves detection performance.  相似文献   

19.
Fast and robust product assembly stage recognition is a key step in human–machine cooperative assembly. To solve the recognition problem of similar adjacent assembly stages, a marker-less assembly stage recognition method is proposed based on corner feature between an assembling product and a digital model. Considering the geometric features of mechanical products, a corner identification method is proposed based on the circumferential angle difference (CADF). Then a corner matching method based on distance constraint is studied for ICP registration to realize the point cloud registration between the product and digital model. Based on the registration relationship, a similarity algorithm based on proximity point proportion is used to calculate the similarity between models and the input assembling product. The model with the greatest similarity is taken as the stage recognition result. In experiments on four group assembling products, the average stage recognition accuracy is 96.15%, which indicates that the proposed method can solve the stage recognition problem. The corner identification method based on the CADF outperforms the Harris-3D corner detection method in the efficiency of assembly stage recognition.  相似文献   

20.
为了得到实用性强的垃圾邮件过滤方法,将距离函数分类法首次引入到垃圾邮件过滤中.在通用邮件语料库上进行测试,并与目前过滤性能较好的KNN算法进行比较,实验结果显示距离函数分类法中的类中心向量法不适合用于垃圾邮件的过滤,而类重心向量法在保持较高过滤性能的同时,具有训练和过滤速度快的优点,是一种理想实用的垃圾邮件过滤方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号