首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
姚笑秋  李慧  王萍 《福建电脑》2009,25(3):17-18
分类是数据挖掘中的一个重要分支。其中决策树方法因为分类速度快、精度高以及易于理解等.而成为数据挖掘中广泛使用的一种分类方法。本文分析了基于属性相似度的决策树分类算法及其不足.提出了改进的基于属性相似度的算法,并将其应用于高校人力资源管理中。例子和实验结果表明了改进算法的有效性。  相似文献   

2.
朴素贝叶斯分类算法简单且高效, 但其基于属性间强独立性的假设限制了其应用范围. 针对这一问题, 提出一种基于属性选择的改进加权朴素贝叶斯分类算法(ASWNBC). 该算法将基于相关的属性选择算法(CFS)和加权朴素贝叶斯分类算法(WNBC)相结合, 首先使用CFS算法获得属性子集使简化后的属性集尽量满足条件独立性, 同时根据不同属性取值对分类结果影响的不同设计新权重作为算法的加权系数, 最后使用ASWNBC算法进行分类. 实验结果表明, 该算法在降低分类消耗时间的同时提高了分类准确率, 有效地提高了朴素贝叶斯分类算法的性能.  相似文献   

3.
客户分类系统的ID3算法流程及实现   总被引:1,自引:0,他引:1  
通过选取决策树中的ID3算法对客户进行分类,对ID3算法进行了简要的概括,研究基于信息增益的度量选择测试属性方法,使用JAVA语言自主编程实现分类功能,并运用程序对一组数据进行处理得出分类结果。  相似文献   

4.
针对决策粗糙集属性约简在引入代价后分类精度不高的问题,对其中代价敏感与分类精度的平衡进行了研究。将分类总代价和近似分类质量作为属性约简过程中的约束条件,结合模拟退火方法,提出了一个基于代价敏感和近似分类质量的决策粗糙集属性约简(ARACOQ)算法。利用UCI数据集对算法进行了模拟实验,实验结果验证了ARACOQ算法的有效性,该算法能够在可承受代价范围内找到一个分类精度最高的属性约简集。  相似文献   

5.
数字水印有多种属性,水印的鲁棒性是水印重要属性之一.根据水印鲁棒性的不同可将水印分为鲁棒性水印和脆弱性水印,这两种属性是对立的属性,因此某种使用智能分类算法能够将这两种水印相互区分.决策树算法是一种有监督的实例分类算法,能够将不同属性的实例进行分类,已在多个学科领域进行应用.使用决策树算法对的数字水印进行分类可以作为水印分类算法方法的补充.  相似文献   

6.
对于高维度小样本数据的分类问题,高维属性的复杂性限制了分类模型预测的准确率。为了进一步提高准确率,提出了基于线性回归和属性集成的分类算法。首先,采用线性回归为每一个属性构建属性线性分类器(Attri-bute Linear Classifier,ALC);其次,为了避免因ALC数量过多而导致准确率下降,利用经验风险最小化策略中的经验损失值作为评估标准来优选ALC;最后,应用多数投票法来集成被筛选的ALC。采用高维度小样本的基因表达数据集进行实验,结果显示该算法具有比逻辑回归、支持向量机和随机森林算法更高的准确率。  相似文献   

7.
基于相关的属性选择算法是一种属性子集评价方法,该算法通过启发式评价消除属性子集中属性之间的相关性,使用评价值选择与类属性相关度高而属性之间相关度低的属性子集。提出在基于相关的属性选择算法中加入属性之间相关度方差的影响,能够在基于相关的属性选择算法选择的属性集子的基础上,去除属性子集中那些与其他属性相关度大的属性。通过实验证明,改进后的算法选择的属性子集属性数不多于基于相关的属性选择算法选择的属性子集属性数。使用改进算法选择的属性子集,在对分类器分类正确率影响很小的情况下,有较高的分类效率。  相似文献   

8.
谢印宝  张佑生 《计算机工程》2000,26(12):150-151,154
在大数据库中确定关键条件属性集,是使用基于粗集理论的集合论生成分类规则算法的重要步骤。该文在简述分类规则形成算法的基础上,对确定关键条件属性集的模糊聚类算法进行了详细的讨论,并给出该方法应用的一个实例。  相似文献   

9.
丁春荣  李龙澍 《微机发展》2007,17(11):110-113
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的ID3算法结构简单,并且能提高分类效率。  相似文献   

10.
多属性决策支持向量机模型与算法   总被引:2,自引:0,他引:2  
王强  沈永平  陈英武 《控制与决策》2006,21(12):1338-1342
分析了多属性决策问题.提出了基于支持向量机的多属性决策方法。首先分析了多属性决策支持向量机方法的机理;其次建立了多属性决策支持向量机方法的价值函数决策模型和方案序关系决策模型,用以训练支持向量机;再次提出了基于支持向量回归和分类的多属性决策支持向量机实现算法;最后给出了一个算例。  相似文献   

11.
知识的一致性分析是知识系统中的一个重要问题,是知识系统正常运行的基础。常规的知识一致性分析采用逻辑分析的方法进行,但不能完全解决实际系统中的知识不一致的问题,主要原因是严格的逻辑系统对满足约束条件的知识无法进一步分析。本文中提出的基于语义贴近度和多元线性回归模型的知识一致性分析方法正好弥补了这一缺点。在文章中给出了语义贴近度的定义及相应的算法设计。  相似文献   

12.
基于属性分类的数据挖掘方法   总被引:13,自引:0,他引:13  
随着数据仓库的广泛应用,从数据中获取相关的知识或规则越发显得重要,各种各样的数据挖掘技术提出了出来,本文介绍一个基于数据属性值的数据挖掘方法。首先简单介绍了ID3分类技术,然后详细论述了基于属性值分类的数据挖掘的方法。该方法有两个的步骤:数据采集,整理及形成规则并化简规则。  相似文献   

13.
Pattern Analysis and Applications - This paper presents a workbench to get simple neural classification models based on product evolutionary networks via a prior data preparation at attribute level...  相似文献   

14.
各种不同类型的支持向量机及其性能比较分析   总被引:5,自引:1,他引:4  
支持向量机(SVM)是由Vapnik等人提出的解决分类、线性回归问题的可行方法。在模式识别等问题中有广泛的应用,并在应用中衍生出了多种不同的形式。文章从统计学习理论入手,在讲述SVM一般原理的基础上,分析比较不同种的支持向量机的性能。由于分析从两个角度进行,所提出的方法能够涵盖,并区分绝大多数现有SVM。  相似文献   

15.
基于粗糙集的CBR系统属性约简改进算法   总被引:1,自引:1,他引:0       下载免费PDF全文
提出一种基于粗糙集的改进的约简算法和决策表预处理方法,在对决策表进行预处理后,以核为基础,用改进的加权属性重要度方法选择非核属性,增加反向删除操作。该算法能够充分反映专家经验知识,保证得到一个Pawlak约简,大幅度提高案例的检索效率。运用Matlab编程实现了该算法,通过实例对算法进行分析、对比,证明了其正确性和有效性。  相似文献   

16.
杨安平  陈松乔  胡鹏 《计算机工程》2011,37(12):164-165
提出一种基于图嵌入正则化的人脸线性判别分析方法。构造非监督最优类可分准则,基于图嵌入理论,求解该最优类可分准则下的最优投影向量,在非监督的图嵌入框架下利用样本局部类别信息提高人脸识别率,降低矩阵计算复杂度。在典型的人脸数据库上的实验证明了该方法的有效性。  相似文献   

17.
具有高可理解性的二分决策树生成算法研究   总被引:3,自引:0,他引:3  
蒋艳凰  杨学军  赵强利 《软件学报》2003,14(12):1996-2005
二分离散化是决策树生成中处理连续属性最常用的方法,对于连续属性较多的问题,生成的决策树庞大,知识表示难以理解.针对两类分类问题,提出一种基于属性变换的多区间离散化方法--RCAT,该方法首先将连续属性转化为某类别的概率属性,此概率属性的二分法结果对应于原连续属性的多区间划分,然后对这些区间的边缘进行优化,获得原连续属性的信息熵增益,最后采用悲观剪枝与无损合并剪枝技术对RCAT决策树进行简化.对多个领域的数据集进行实验,结果表明:对比二分离散化,RCAT算法的执行效率高,生成的决策树在保持分类精度的同时,树的规模小,可理解性强.  相似文献   

18.
基于类频繁模式树的关联分类   总被引:1,自引:0,他引:1  
提出一种新的基于类频繁模式树的关联分类算法CFPC(Class FP-tree based Classifier).该方法基于FP-tree实现,无需生成庞大的候选项目集;依据记录的分类属性进行指导性划分,并使用类支持度进行记录项的分类剪枝,生成类模式树,避免了小数据类别集上的强关联模式遗漏;挖掘出的规则形成分类器,用于类标号未知的记录的区分.试验结果表明CFPC的正确性和有效性.  相似文献   

19.
线性判别分析(LDA)是一种普遍用于特征提取的线性分类方法。但将LDA直接用于人脸识别会遇到小样本问题和秩限制问题。为了解决以上问题,提出一种基于多阶矩阵组合的LDA算法——MLDA。该算法重新定义了传统LDA中的类内离散度矩阵Sw,使传统Fisher准则具有更好的健壮性和适应性。若干人脸数据库上的比较实验证明了MLDA的有效性。  相似文献   

20.
提出了依照并行搜索树的思想,将订阅的属性集划分为2个属性子集,在2个子集上分别构建一个并行搜索树。匹配事件时,在两个搜索树上分别得到该事件匹配的订阅集,两个集合的交集即为最终结果。分析及实验结果表明:划分并行搜索树可以减少搜索树的节点数,降低对存储空间的需求,并潜在地缩短事件匹配时间,尤其适合于节点分支数多而匹配分支少时的情况。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号