首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
两种新的决策表属性约简概念   总被引:11,自引:1,他引:11  
经典粗糙集理论属性约简的两种定义在对不相容决策表约简时会出现不一致性,本文通过分析这种不一致性,提出了平均决策强度和决策熵的概念,并由此给出了两种新的属性约简定义.通过理论分析和实例验证,用这两种新的属性约简定义对不相容决策表约简的结果是一致的,并且该约简结果更能客观地反映决策表的“决策能力”的实质.  相似文献   

2.
路静  张涛  任宏雷 《计算机工程与应用》2012,48(28):135-138,233
根据经典粗糙集方法,在对可约简决策表进行属性约简时可能出现核不存在无法找到起点属性从而无法约简的问题。针对该问题,提出了基于聚类率的属性约简方法。计算决策表的区分矩阵,以属性区分度为基础,在属性区分度相同的情况下,利用聚类率修正属性重要度,保证起点属性存在的必然性,从而完成起点属性的求取并获得决策表的属性约简。实验分析表明,方法可以保证可约简决策表中起点属性的计算,且利用该方法获得的约简结果保持了较高的决策准确率,是有效可行的。  相似文献   

3.
本文以分类为基础提出了一种基于条件熵的决策表属性并行约简算法。该算法通过条件熵的计算在属性约简的同时将原决策表逐层分解为相对于决策属性来说尽量均匀的子决策表,从而实现了属性约简的并行计算。本文随后对该算法的时间复杂度进行了分析,实验表明,该算法在效率方面优于传统算法。  相似文献   

4.
属性约简是粗糙集(rough set,RS)理论进行规则提取中的重要步骤之一.决策表的最小属性约简是NP-hard问题.遗传算法(genetic algorithm,GA)是求解此类问题的有效方法之一,但在利用遗传算法求解属性约简过程中,需要计算各个个体的适应度,每计算一个个体的适应度,需要根据该个体代表的属性组,组织决策表,对组织后的决策表进行扫描,这样,算法就需要多次对决策表进行操作,影响到算法的执行效率.我们基于集合理论,提出了关系积概念,把决策表的属性约简过程转化为关系积的运算,利用关系积计算遗传算法各个体的适应度,不需要扫描决策表,避免了对决策表的操作,提高了遗传算法求解属性约简的效率,通过实例对这一算法进行了详细的描述.  相似文献   

5.
基于粗糙集的快速属性约简算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
通过分析现有相容决策表属性约简算法,找出了计算低效性的根源。新的约简算法从论域的角度出发,采用层次结构,用属性边界域作为度量属性重要性启发函数。该算法使得论域不断缩小的同时,又能选出反映决策表系统特征的重要属性。理论分析和实验表明,该算法保证在分类精度不变的前提下,获得最优或次优的约简属性集。  相似文献   

6.
基于粗糙集理论的客户关系管理   总被引:1,自引:0,他引:1  
粗糙集理论是一种新型的数据挖掘和决策分析方法,利用粗糙集理论进行决策表的知识约简与决策规则挖掘已经成为研究热点。本文介绍了粗糙集的基本理论,通过决策属性支持度定义的条件属性对决策属性重要性的启发式信息,求取决策表的最小约简。并将该方法用于对企业客户进行分类,为客户关系管理的决策支持提供了新的解决方法。  相似文献   

7.
给出完备决策表和不完备决策表的定义并说明相容关系.给出了相容矩阵及其属性约简的定义,同时也给出差别矩阵及其属性约简的定义,证明了基于相容矩阵的属性约简与关于差别矩阵的属性约简定义是等价的,给出了一个计算条件属性的频率的公式,该公式不必计算差别矩阵,而是直接从决策表中计算出各条件属性在差别矩阵中出现的频率.设计一个快速计算条件属性频率的快速算法,在此基础上,设计了一个高效求基于相容矩阵的属性约简算法,并通过实例对该算法进行了验证.实践证明:算法的复杂度都得以降低,该算法的时间复杂度为O(|C|2|U|),空间复杂度为O(|U|).该方法为计算其他的属性约简算法提供了一条新思路.  相似文献   

8.
提出了一种处理海量的不完备决策表的方法。将基于互信息的属性重要度作为启发式信息,利用遗传算法对不完备的原始决策表中的条件属性进行约简,形成包含missing值的决策表,称为优化决策表。利用原始决策表自身的信息,通过属性扩展,从优化决策表中抽取一致性决策规则,而无须计算missing值。该方法在UCI的8个数据集上的实验结果优于EMAV方法,是一种有效的从海量不完备决策表中抽取规则的方法。  相似文献   

9.
鲍迪  张楠  童向荣  岳晓冬 《计算机应用》2019,39(8):2288-2296
实际应用中存在大量动态增加的区间型数据,若采用传统的非增量正域属性约简方法进行约简,则需要对更新后的区间值数据集的正域约简进行重新计算,导致属性约简的计算效率大大降低。针对上述问题,提出区间值决策表的正域增量属性约简方法。首先,给出区间值决策表正域约简的相关概念;然后,讨论并证明单增量和组增量的正域更新机制,提出区间值决策表的正域单增量和组增量属性约简算法;最后,通过8组UCI数据集进行实验。当8组数据集的数据量由60%增加至100%时,传统非增量属性约简算法在8组数据集中的约简耗时分别为36.59 s、72.35 s、69.83 s、154.29 s、80.66 s、1498.11 s、4124.14 s和809.65 s,单增量属性约简算法的约简耗时分别为19.05 s、46.54 s、26.98 s、26.12 s、34.02 s、1270.87 s、1598.78 s和408.65 s,组增量属性约简算法的约简耗时分别为6.39 s、15.66 s、3.44 s、15.06 s、8.02 s、167.12 s、180.88 s和61.04 s。实验结果表明,提出的区间值决策表的正域增量式属性约简算法具有高效性。  相似文献   

10.
属性约简是粗糙集的一个核心研究课题,但经典属性约简及其延伸算法是基于有决策属性的决策表的属性约简算法,它们对无决策属性的非常规决策表的属性约简无能为力。以粗糙集理论为基础,对无决策属性的非常规决策表从分形维数方面进行研究,提出了一种适用于无决策属性的决策表的启发式属性约简算法。该算法在一定程度上能够解决非常规决策表的属性约简问题,进一步扩展了粗糙集理论的应用范围。实例表明该算法是有效可行的。  相似文献   

11.
一种基于决策矩阵的属性约简及规则提取算法   总被引:17,自引:1,他引:16  
研究了Rough集理论中属性约简和值约简问题,扩展了决策矩阵的定义,提出了一种基于决策矩阵的完备属性约简算法,该算法利用决策属性把论域划分成多个等价类,然后利用每个等价类对应的决策矩阵计算属性约简。与区分矩阵相比,采用决策矩阵可以有效地减少存储空间,提高约简算法效率。同时,借助决策矩阵进行值约简,提出了一种新的规则提取算法,使最终得到的决策规则更加简洁。实验结果表明,本文提出的属性约简和值约简算法是正确、有效、可行的。  相似文献   

12.
不一致决策表信息熵约简与代数约简的核计算与转化   总被引:2,自引:2,他引:0  
对不一致决策表,信息熵约简与代数约简有时会得到不同的属性约简和核属性,当前的方法多为先将不一致决策表转化为一致决策表,再对后者寻求高效算法.本文基于等价差别矩阵具有相同的核属性和属性约简的思想,提出一种以条件属性等价类构造简化的代数约简差别矩阵,从差别矩阵内部进行比较与分析,发现只须将信息熵约简差别矩阵中由同时为矛盾对象所产生的可辩识属性集剔除,即可转化为简化的代数约简差别矩阵,从而得到将信息熵约简核属性转化为代数约简核属性的新方法,理论分析与数值算例都验证了其正确性.  相似文献   

13.
在决策表中,决策规则的可信度和对象覆盖度是衡量决策能力的重要指标。以知识粗糙熵为基础,提出决策熵的概念,并定义其属性重要性;然后以条件属性子集的决策熵来度量其对决策分类的重要性,自顶向下递归构造决策树;最后遍历决策树,简化所获得的决策规则。该方法的优点在于构造决策树及提取规则前不进行属性约简,计算直观,时间复杂度较低。实例分析的结果表明,该方法能获得更为简化有效的决策规则。  相似文献   

14.
噪声数据降低了多变量决策树的生成效率和模型质量,目前主要采用针对叶节点的剪枝策略来消除噪声数据的影响,而对决策树生成过程中的噪声干扰问题却没有给予关注。为改变这种状况,将基本粗糙集(rough set,RS)理论中相对核的概念推广到变精度粗糙集(variable precision roughset,VPRS)理论中,并利用其进行决策树初始变量选择;将两个等价关系相对泛化的概念推广为两个等价关系多数包含情况下的相对泛化,并利用其进行决策树初始属性检验;进而给出一种能够有效消除噪声数据干扰的多变量决策树构造算法。最后,采用实例验证了算法的有效性。  相似文献   

15.
一种基于Rough Set理论的属性约简及规则提取方法   总被引:133,自引:1,他引:132  
常犁云  王国胤  吴渝 《软件学报》1999,10(11):1206-1211
该文针对Rough Set理论中属性约简和值约简这两个重要问题进行了研究,提出了一种借助于可辨识矩阵(discernibility matrix)和数学逻辑运算得到最佳属性约简的新方法.同时,借助该矩阵还可以方便地构造基于Rough Set理论的多变量决策树.另外,对目前广泛采用的一种值约简策略进行了改进,最终使得到的规则进一步简化.  相似文献   

16.
上近似、下近似是粗糙集理论的基本概念,由上下近似概念可导出粗糙集的正域、负域、边界等概念。对于决策信息系统,决策属性的等价类可以用粗糙集理论的上下近似来刻画,边界反映了其粗糙性。分析决策信息系统的边界类属性,结合可变精度粗糙集与经典粗糙集理论,对比边界类属性与正域类属性及负域类属性的差别,提出了正向迁移属性和负向迁移属性概念,结合例子给出正向迁移属性与负向迁移属性的求法,并对其意义加以说明。  相似文献   

17.
研究了基于对象定向概念格的决策形式背景的属性约简的定义和方法。在对象幂集上引入一个等价关系,并介绍了相关性质。提出了决策形式背景的协调性的定义,进而利用等价关系给出了协调决策形式背景的属性约简定义。该定义下的属性约简集能保持由原属性集确定的所有等价类不变的最小属性子集,同时它也能保持所有对象定向概念的外延不变。利用辨识矩阵提出了一种用于计算所有属性约简集的方法。  相似文献   

18.
食品安全决策是食品安全问题研究的一项重要内容。为了对食品安全状况进行分析,基于粗糙集变精度模型,提出了一种包含规则置信度的构造决策树新方法。这种新方法针对传统加权决策树生成算法进行了改进,新算法以加权平均变精度粗糙度作为属性选择标准构造决策树,用变精度近似精度来代替近似精度,可以在数据库中消除噪声冗余数据,并且能够忽略部分矛盾数据,保证决策树构建过程中能够兼容部分存在冲突的决策规则。该算法可以在生成决策树的过程中,简化其生成过程,提高其应用范围,并且有助于诠释其生成规则。验证结果表明该算法是有效可行的。  相似文献   

19.
针对决策树C4.5算法在处理连续值属性过程中时间复杂度较高的问题,提出一种新的决策树构建方法:采用概率论中属性间的相关系数(Pearson),对数据集中的属性进行约简;结合属性的信息增益率,保留决策属性的最优子集,保证属性子集中没有冗余属性;采用边界点的判定,改进了连续值属性离散化过程中阈值分割方法,对信息增益率的计算进行修正。采用UCI数据库中的数据集,在Pycharm平台上进行一系列对比实验,结果表明:采用改进后C4.5决策树算法,决策树生成效率提高了约50%,准确率提升约2%,比较有效地解决了原C4.5算法属性选择偏连续值属性的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号