首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
规则提取是RST中一个重要的研究方向,本文提出了不完备信息系统的相对正域的概念,通过简单的集合运算就可以求得相对正域;利用相对正域选择决策树的结点,构造一棵决策树,完成对不完备信息系统的规则提取。  相似文献   

2.
决策树是一种有效地进行实例分类的数据挖掘方法。在处理不完备信息系统中的缺省值数据时,现有决策树算法大多使用猜测技术。在不改变缺失值的情况下,利用极大相容块的概念定义了不完备决策表中条件属性对决策属性的决策支持度,将其作为属性选择的启发式信息。同时,提出了一种不完备信息系统中的决策树生成算法IDTBDS,该算法不仅可以快速得到规则集,而且具有较高的准确率。  相似文献   

3.
极大相容块技术在不完备信息处理方面具有一定优势,但极大相容块获取本身是个耗时的过程。通过分析不完备信息系统中极大相容块的性质特点,给出极大相容块中不完备数据的相容填补方法;在不完备信息系统中使用相容填补方法,得到一种新的极大相容块构造算法;基于构造算法的特点,引入决策树存储结构对算法进行优化。使用标准的数据集验证了构造算法的有效性。实验结果表明,构造算法在较大规模的数据集上有较好的性能。  相似文献   

4.
不完全信息系统中遗失数据的补充和规则的提取,一直是数据挖掘技术面临的重要问题。文中给出了一种基于决策树来求解此问题的算法。对于给定的不完全决策表,该算法应用改进的ID3算法来构造决策树,在构造决策树的过程中对遗失值进行补充。对于不能在决策树上补充的遗失值,定义了一种相关对象之间的相似度来填充。该算法简单,易于操作。  相似文献   

5.
粗糙集理论在不完备信息系统中应用的研究越来越受到学者们的关注,多个不完备信息系统粗糙集扩展模型先后建立起来.基于限制容差关系的扩展模型是其中一个较为灵活和符合数据挖掘需要的模型.本文基于限制容差关系,将论域分为两个部分,并针对两类不同的对象分别给出了约简的定义,在此基础上提出了决策规则提取和决策规则评估算法.  相似文献   

6.
陈泽华  宋波  闫继雄  柴晶 《控制与决策》2019,34(5):1011-1017
概念格是以概念为元素的偏序集,通常可以对形式背景描述的完备信息系统进行分析和处理,然而在多数情况下信息系统是不完备的,粗糙集理论是一种刻画不完整、不确定性问题的有效方法.针对此问题,从粗糙集的角度出发,基于概念格理论定义一种描述不完备信息系统的增广形式背景,在此基础上,定义并讨论极概念和极概念格及其相关性质,进而提出增广形式背景的极概念生成算法.为了获得更加简洁的决策规则,同时提出一种新的无冗余属性的决策规则获取算法.通过实例计算和UCI数据集的对比实验,表明了所提出算法的可行性和有效性,特别地,当信息系统完备时极概念将退化为经典的概念.  相似文献   

7.
王斌 《福建电脑》2010,26(4):84-84
意外规则的发掘很重要,但当前关于意外规则发掘的研究十分匮乏。本文通过分析两种发掘意外规则的算法,把它们的优点结合起来,提出了一种发掘意外规则的不完备算法,并探讨了新算法的优缺点。  相似文献   

8.
武森  冯小东  单志广 《计算机学报》2012,35(8):1726-1738
缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法.受不完备数据分析(ROUSTIDA)未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的.  相似文献   

9.
基于粗糙集的不完备信息系统规则推理算法   总被引:6,自引:0,他引:6  
定义了非对称相似关系的近似集概念,提出了一种利用非对称相似关系下近似集和属性值对的基于粗糙集的确定规则推理算法.该算法无需改变初始不完备信息系统的结构,能直接处理缺省数据.实验结果表明,所获得的确定决策规则简洁、高效,与缺省值无关.  相似文献   

10.
对象信息的不完备性是从实例中归纳学习的最大障碍.本文定义了限制非对称相似关系,并将经典的可辨识关系矩阵加以扩充,定义了限制非对称相似关系下的可辨识关系矩阵,采用布尔推理方法,直接从不完备决策系统中提取规则而无需改变初始不完备信息系统的结构.实验结果表明,所获得的决策规则简洁、高效,与缺省值无关.  相似文献   

11.
随着网络犯罪的日益猖獗,计算机取证正逐步成为人们研究与关注的焦点.为了能从海量的可疑数据中发现证据,数据挖掘技术的参与必不可少.首先介绍了在计算机取证中比较常用的数据挖掘分类分析方法,然后介绍其在计算机取证原型系统中的实现和应用,最后给出了进一步研究的方向:多样证据的提取及其之间的关联.  相似文献   

12.
一种新的决策树归纳学习算法   总被引:79,自引:1,他引:79  
本文不示例学习的重要分枝--决策树归纳学习进行了分析探讨,从示例学习最优化的角度分析了决策树归纳学习的优化原则,指出了以往的以ID3为代表的归纳学习算法所固有的缺陷,并提出了一种新的基于概率的决策树归纳学习算法PID,PID在扩展属性的选择上仍采用基于信息增益率的方法,但在树上的扩展过程中,采用属性聚类的方法进行树的支合并。PID得到的决策树在树的规模和分类精度上都优于ID3。  相似文献   

13.
一个增量式判定树学习算法INDUCE   总被引:1,自引:0,他引:1  
INDUCE算法采用自顶向下判定树归纳的学习方法,不仅具有健壮性好,效率高和正确率高等优点,还具有增量学习能力,可以动态修正概念描述的不足,该算法还运用了构造性归纳的思想,在学习过程中生成新的描述子,使概念描述空间搜索的效率得到提高。运行实例表明,INDUCE具有很好的应用前景。  相似文献   

14.
通过分析ID3算法的基本原理及其多值偏向问题,结合矫正函数提出一种决策树优化算法。首先通过引进矫正函数对ID3算法进行改进,从而克服其多值偏向问题,然后运用数学中泰勒公式和麦克劳林公式的性质,对信息增益公式进行近似简化。标准数据集UCI上的实验结果表明,优化后的ID3算法不仅解决了原ID3算法的多值偏向问题,而且在构建决策树的过程中,既提高了平均分类准确率,又降低了构建决策树的复杂度,并且还缩短了决策树的生成时间。当数据集中的样本数较大时,优化后的ID3算法的效率得到了明显的提高。  相似文献   

15.
极小极大规则学习及在决策树规则简化中的应用   总被引:3,自引:0,他引:3  
文中在粗糙集理论中的约简概念的启发下提出极小规则和极大规则的概念及极小极大规则学习。  相似文献   

16.
一种新的基于属性—值对的决策树归纳算法   总被引:5,自引:1,他引:5  
决策树归纳算法ID3是实例学习中具有代表性的学习方法。文中针对ID3易偏向于值数较多属性的缺陷,提出一种新的基于属性-值对的决策树归纳算法AVPI,它所产生的决策树大小及测试速度均优于ID3。该算法应用于色彩匹配系统,取得了较好效果。  相似文献   

17.
针对C4.5决策树算法在构造决策树时只考虑属性对类的影响,忽视了属性间相互影响的问题。提出一种改进的决策树算法DTEAT(Decision Tree with Elimination of Attribute Dependency),该算法通过计算属性间的信息增益率来量化属性间相互影响的程度(依赖度)。在构造决策树的过程中,计算待分裂属性与其他每个属性的依赖度,将其均值作为选择分裂属性时的主要度量标准之一,从而消除属性间的依赖。实验结果表明,改进后的算法在UCI的样本数据集上的分类准确率有了显著的提升,最高提升了7个百分点。  相似文献   

18.
针对ID3算法多值偏向及误分类代价被忽视的问题,结合属性相似度和代价敏感学习,提出基于均衡系数的决策树优化算法。该算法既克服了多值偏向,又考虑了误分类代价问题。首先引进属性相似度和性价比值两者的均衡系数,对ID3算法进行改进;然后运用麦克劳林公式对ID3算法进行公式简化;最后将算法改进和公式简化相结合,得到基于均衡系数的决策树优化算法。实验结果表明,基于均衡系数的决策树优化算法,既能够提高分类精度,缩短决策树生成时间,又能考虑代价问题并降低误分类代价,还能克服多值偏向问题。  相似文献   

19.
基于动态粗集理论,提出一种改进的动态粗集决策树算法。改进后的算法对每一属性计算数据对象迁移系数的和,值最大的属性成为决策树的根;在对决策树分叉时,给每一决策类别的数据对象集合计算从根到分叉属性所构成的属性集的膨胀度,值大的属性构成分支结点。算法在UCI机器学习数据库原始数据集及其噪音数据集上的实验结果表明,该算法构造的决策树在规模与分类准确率上均优于ID3算法及C4.5算法。  相似文献   

20.
字素音素转换是德语自然语言处理中的难点之一。提出一种基于决策树的字素音素转换的监督学习算法。在一个字素音素平行语料库的基础上,通过决策树进行字素音素转换的监督学习,生成字素音素转换规则。经交叉测试,平均转换正确率可达98. 03%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号