首页 | 本学科首页   官方微博 | 高级检索  
检索     
共有20条相似文献,以下是第1-20项 搜索用时 859 毫秒

1.  一种高效的数据流挖掘增量模糊决策树分类算法  被引次数:3
   王涛  李舟军  胡小华  颜跃进  陈火旺《计算机学报》,2007年第30卷第8期
   数据流具有数据持续到达、到达速度快、数据规模巨大等特点,这些都给数据流挖掘领域的研究工作带来了新挑战,而其中分类算法更是当前的研究热点.Domingos等在VFDT中利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题.Gama等对VFDT进行扩展并实现了VFDTc,使系统能够处理连续属性.Peng等在传统数据挖掘环境下提出了基于模糊理论的连续属性平滑离散化方法.基于前述工作,作者设计并实现了一种基于线索化排序二叉树的增量模糊决策树分类算法fVFDT,其主要贡献有如下4点:(1)第一次设计并实现了数据流上的基于线索化二叉排序树(TBST)的连续属性处理方法.相比VFDT,fVFDT的样本插入时间复杂度由O(n2)降低到O(nlogn).当新样本到达时,VFDTc需要更新O(logn)个属性节点,而fVFDT只需要更新相应的一个节点即可;(2)改进了VFDTc连续属性的最佳划分节点选取的计算方法,使其时间复杂度由O(nlogn)降低到O(n);(3)根据Fayyad等的研究成果,相比VFDTc,fVFDT只需从更少的备选划分节点中选取最佳节点,备选划分节点数由O(n)降低到O(logn);(4)改进了传统数据挖掘环境下的基于模糊理论的连续属性平滑离散化方法,有效地处理了噪声数据,很好地提高了分类精度.    

2.  一种高效的基于排序二叉树的数据流挖掘算法  
   何昭青《计算机工程与科学》,2008年第30卷第11期
   数据流挖掘分类技术是数据挖掘领域非常具有挑战性的工作。VFDT利用Hoeffding不等式很好地解决了在数据流上进行单遍扫描获取高精度决策树的问题;VFDTc改进了VFDT,使其能够处理连续属性。基于VFDT和VFDTc,我们设计并实现了一种基于排序二叉树的高效算法VFDT-BSTree。该算法解决了VFDTc中存在的问题,提高了样本动态插入和最佳划分节点选取的速度,从而提高了分类速度。实验结果表明,VFDT-BSTree在保持决策树大小和分类精度不变的基础上,执行时间相比VFDT平均减少32.25%,比VFDTc平均减少24.96%。    

3.  一种数据流分类中的聚类决策树框架算法  
   吴小志  胡健  朱广新  茹萌《计算机安全》,2014年第3期
   为了平衡隐含概念漂移的数据流分类算法的分类精度和效率之间的矛盾,提出了基于聚类决策树的框架来处理快速到达的数据流,通过将不能实时分类的数据预聚类成n个类,并基于聚类结果产生VFDT新分支或替代原有分支。实验结果证明,聚类决策树框架算法在预测精度和效率上均有一定的提升。    

4.  无存储器中冲突的并行快速排序算法  
   管丽《软件学报》,1996年第7卷第A00期
   本文在一个EREW PRAMexclusive read exclusive write paralled random access machine)上提出一个并行快速排序算法,这个算法用K个处理器可将N个项目在平均O(n/k+logn)logn)时间内排序,所以平均来说算法的时间和处理器数量的乘积对任何k≤n/logn是O(nlogn)。    

5.  基于图形硬件的双调排序算法优化  
   宾洪斌  何锫  胡明辉《计算机工程与设计》,2008年第29卷第14期
   介绍一种新的并行排序算法,该算法以双调归并排序为基础,运用图形硬件的并行体系结构和二叉排序树数据结构的优点,用部分并行代替所有阶段的顺序执行,对双调排序算法进行优化.对该算法进行分析,在理论上n个序列在P个流处理器上的排序,最优的时间复杂度为O((nlogn)/p).实验测试结果表明,优化后的算法比其它基于图形硬件的双调归并排序算法所用时间短.    

6.  属性频率划分和信息熵离散化的决策树算法  被引次数:1
   李春贵  王萌  孙自广  王晓荣  张增芳《计算机工程与应用》,2009年第45卷第12期
   决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的度量直接影响决策树分类的效果。基于粗糙集的属性频率函数方法度量属性重要性,并用于分枝划分属性的选择和决策树的预剪枝,提出一种决策树学习算法。同时,为了能处理数值型属性,利用数据集的统计性质为启发式知识,提出了一种改进的数值型属性信息熵离散化算法。实验结果表明,新的离散化方法计算效率有明显提高,新的决策树算法与基于信息熵的决策树算法相比较,结构简单,且能有效提高分类效果。    

7.  在数据流管理系统中实现快速决策树算法(英文)  
   袁磊  张阳  李梅  李雪  王勇《计算机科学与探索》,2010年第4卷第8期
   在数据流管理系统(data stream management system,DSMS)中嵌入数据挖掘算法对数据库研究者是一项新的挑战,而在数据流管理系统中嵌入快速决策树(very fast decision tree,VFDT),尚未见报道。利用DSMS原有的机制在Esper中实现了VFDT算法。其主要思想是将VFDT算法转换为Esper的数据查询语言(Esper query language,EQL)。给出了在DSMS中实现VFDT算法的两种方法:普通方法。直接将VFDT算法转化为EQL语言并在DSMS中实现(记作DVFDT);改进方法。通过Esper中固有的批量处理模式来实现(记作optimal-DVFDT)。通过一系列实验比较分析了两种方法对海量数据流分类的准确率和性能;将提出的两种方法与用Java实现的VFDT算法(记作JVFDT)在分类精度和时间上进行比较。结果表明,在DSMS中实现的VFDT算法具有较好的性能,并且该算法对大规模数据流数据的子集同样具有较高的性能。    

8.  数据挖掘中的属性处理方法比较研究  
   许俊《福建电脑》,2006年第12期
   决策树是分类数据挖掘的重要方法。其中,经典ID3算法根据具有最大信息增益的属性对训练样本集进行分类,适用于离散型属性。C4.5算法延用了ID3算法的基本策略,增加了处理连续数值型属性的方法。本文在其基础上讨论了新的基于属性变换的离散化处理方法。该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度。    

9.  一种基于哈希链表的高效概念漂移连续属性处理算法  
   王涛  李舟军  颜跃进《计算机工程与科学》,2008年第30卷第8期
   本文重点研究了数据流挖掘中存在概念漂移情形的连续属性处理算法。数据流是一种增量、在线、实时的数据模型。VFDT是数据流挖掘中数据呈稳态分布情形下最成功的算法之一;CVFDT是有效解决数据流挖掘中概念漂移问题的算法之一。基于CVFDT,本文提出了有效地解决数据流挖掘中存在概念漂移情形的连续属性处理问题的扩展哈希表算法HashCVFDT。该算法在属性值插入、查找和删除时具有哈希表的快速性,而在选取每个连续属性的最优化划分节点时解决了哈希表不能有序输出的缺点。    

10.  基于流水光总线阵列上的快速可扩展并行排序算法  
   陈宏建  陈崚  秦玲  徐晓华  屠莉《计算机工程》,2004年第30卷第24期
   在Y.Pan提出的基于流水光总线阵列模型(LARPBS)上使用N个处理器对N个元素进行排序在最好情况下以O(logN)时间,最坏情况下以O(N)时间完成的并行排序算法的基础上,提出了一种LARPBS模型上的可扩展的快速并行排序算法,对N个元素进行排序,使用p(1≤P≤N)个处理器在最好情况下以O(NlogN/p)时间,最坏情况下以O(N^2/p)时间完成排序。另外还提出了一种LARPBS模型上改进的快速高效并行排序算法,该算法对N个元素进行排序使用N个处理器在最好情况下以O(log√N)时间、最坏情况下以O(√N)时间完成排序。    

11.  一种简单的平滑公平轮转调度算法  
   郭子荣  曾华燊  窦军《计算机科学》,2016年第43卷第1期
   根据通用处理器共享的公平排队思想,针对数据包或信元交换,提出了一种将数据流的预订速率作为时隙分配的权值来构建动态调度树的公平轮转调度算法。其主要思路是:当有新数据流到达时,将各数据流按其权值均匀分布到完全二叉树的叶子节点上,在每个时隙开始时轮转调度算法负责从叶子节点中依次取出数据流号,发送该数据流的信元,调度复杂度为O(1)。与其他经典的公平调度算法引比,所提出的公平轮转调度算法实现简单。理论分析和仿真结果都表明,这种简单的平滑公平轮转调度算法(SSFRR)具有良好的公平性,对源端为漏桶控制的数据流能够提供端到端的有界时延,且能够提供基于数据流的QoS保证。    

12.  基于n叉树的动态安全群密钥协商协议  
   高玮  胡予濮  杨红梅《计算机应用研究》,2009年第26卷第6期
   将三叉树拓展为n叉树引入到群密钥中,提出了动态安全的基于n叉树的可认证群密钥协商协议。在三叉树的基础上进一步减少了轮数,计算复杂度由O(log3 m)降低为O(logn m),但是单轮内成员间通信量增加。群内成员先进行树结构的划分,每n个节点作为相应上一级节点的孩子节点,n个节点分别选定代表,n个代表通过调用协议BCP协商密钥得到本轮即相应父亲节点的子密钥,重复进行上述过程最终可以得到群组密钥。同时,协议考虑了有成员加入或离开的动态情形并给出了很好的解决方案,一方面保证了动态情形发生时,在前一时刻计算出结    

13.  一种改进的支持向量机多类分类方法  
   郭亚琴  王正群《现代电子技术》,2009年第32卷第20期
   提出一种新的基于二叉树结构的支持向量机(SVM)多类分类方法.该方法解决了现有主要算法中存在的不可分区域问题,具有简单、直观、重复训练样本少的优点.为了提高分类模型的推广能力,必须使样本分布好的类处于二又树的上层节点,才能获得更大的划分空间.因此,该算法采用类间散布度量与类内散布度量的比值作为二叉树的生成算法.采用UCI标准数据集实验,实验结果表明该算法具有一定的优越性.    

14.  滑坡数据连续属性值处理的研究  
   亓呈明  崔守梅《微计算机信息》,2006年第22卷第24期
   数据预处理是提高挖掘过程精度和性能的关键。文章在分析决策树算法和滑坡数据属性值特点基础上,利用聚类将连续属性值划分区间,提出了一种针对滑坡数据连续属性值离散化的方法,通过实验,新方法构造的决策树比原算法的分类正确率高,规则冗余少。    

15.  基于完全二叉树的入侵弹性签名方案  被引次数:1
   李洪伟  孙世新  杨浩淼《四川大学学报(工程科学版)》,2008年第40卷第4期
   入侵弹性技术通过周期性地进化密钥,有效地防止了密钥泄漏带来的危害.利用完全二叉树提出了一个新的入侵弹性签名方案(TBIRS),并且证明了方案的正确性和安全性.TBIRS按照二叉树前序遍历的方式进行密钥的更新,采用随机数加减的方法进行密钥的刷新,以二叉树的叶子节点作为密码系统的时间周期.与目前密钥安全性最好的SiBIR方案比较,TBIRS在取得相同密钥安全性的情况下,算法复杂度却由O(N)降低到O(logN).    

16.  支持向量机多类分类算法研究  被引次数:35
   唐发明  王仲东  陈绵云《控制与决策》,2005年第20卷第7期
   提出一种新的基于二叉树结构的支持向量(SVM)多类分类算法.该算法解决了现有主要算法所存在的不可分区域问题.为了获得较高的推广能力,必须让样本分布广的类处于二叉树的上层节点,才能获得更大的划分空间.所以,该算法采用最小超立方体和最小超球体类包含作为二叉树的生成算法.实验结果表明,该算法具有一定的优越性.    

17.  一种使用控制块消除流图中回边的算法  
   李兰英  张滇  崔林海  胡磊《计算机工程》,2008年第34卷第20期
   引入控制块分解流图来构建控制流树,确定流图中的回边及循环路径中包含的节点,通过消去原流图中的回边,构建无环流图,简化流图的数据流分析。控制块将流图的控制关系转移到新构建的控制流树的内部控制节点上。使用控制块分解算法将流图转换到控制流树过程中,所创建节点数目不超过n,使用控制流树求解路径表达式和确定回边的时间复杂度不超过O(nlogn)。    

18.  网络流量识别的自适应分级滑动窗决策树算法  
           寿国础《计算机应用研究》,2013年第30卷第8期
   针对网络流量存在概念漂移、不同应用类型数据流偏态分布等特性, 提出了基于Hoeffding决策树的自适应分级滑动窗决策树的网络流量识别算法。该算法根据节点信息增益率检测概念漂移、动态调整概念漂移检测窗口及不同类型训练样本集窗口, 实现对不同速率概念漂移的自适应分类和决策树更新。实验结果显示新算法对劣势频繁漂移的应用类型的识别准确率与batch C4. 5算法接近, 比CVFDT算法提高约20%, 可以获得更加均衡的不同应用类型分类准确度。    

19.  具有高可理解性的二分决策树生成算法研究  被引次数:3
   蒋艳凰  杨学军  赵强利《软件学报》,2003年第14卷第12期
   二分离散化是决策树生成中处理连续属性最常用的方法,对于连续属性较多的问题,生成的决策树庞大,知识表示难以理解.针对两类分类问题,提出一种基于属性变换的多区间离散化方法--RCAT,该方法首先将连续属性转化为某类别的概率属性,此概率属性的二分法结果对应于原连续属性的多区间划分,然后对这些区间的边缘进行优化,获得原连续属性的信息熵增益,最后采用悲观剪枝与无损合并剪枝技术对RCAT决策树进行简化.对多个领域的数据集进行实验,结果表明:对比二分离散化,RCAT算法的执行效率高,生成的决策树在保持分类精度的同时,树的规模小,可理解性强.    

20.  一种基于属性频率划分的决策树算法  
   李春贵  原庆能  王萌  任贤华《广西工学院学报》,2007年第18卷第4期
   决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的标准直接影响决策树分类的效果。基于粗糙集的属性频率函数等方法度量属性重要性的概念,将其用于分枝划分属性的选择,提出一种决策树学习算法。该方法仅利用区分矩阵就可以计算出属性的出现频率函数值,计算简单。实验结果表明,用该方法构造的决策树与传统的基于信息熵方法构造的决策树相比较,结构简单,且能有效提高分类效果。    

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号