首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
基于粒计算的不完备信息系统的规则提取方法   总被引:1,自引:1,他引:0       下载免费PDF全文
根据粒计算思想提出了一种从不完备决策表中分层提取确定规则的方法,将决策表进行分解,然后按决策表提供的确定信息分层提取相应的确定规则,在处理过程中认为空值提供的信息是不可靠的,所以与确定值严格加以区分,该方法充分利用不完备信息系统中的确定信息,得到长度不等的确定规则。  相似文献   

2.
基于不完备信息系统的决策树生成算法   总被引:1,自引:1,他引:0  
决策树是一种有效地进行实例分类的数据挖掘方法。在处理不完备信息系统中的缺省值数据时,现有决策树算法大多使用猜测技术。在不改变缺失值的情况下,利用极大相容块的概念定义了不完备决策表中条件属性对决策属性的决策支持度,将其作为属性选择的启发式信息。同时,提出了一种不完备信息系统中的决策树生成算法IDTBDS,该算法不仅可以快速得到规则集,而且具有较高的准确率。  相似文献   

3.
不完备信息系统中决策规则的提取是数据挖掘领域的重要研究问题。对不完备信息系统中决策规则的主要获取方法进行分析,以决策属性具有缺失值的不完备决策表为研究对象,提出一种基于数据优先填补的决策树规则提取算法。针对ROUSTIDA算法在数据填补时运算量较大且容易导致决策规则冲突这一问题,算法采用决策属性优先填补的思想,引入对象完备度概念对其进行改进,使用改进的ROUSTIDA算法对不完备决策表进行一次性数据填补预处理,并在限制容差关系下采用属性重要性为启发函数构建决策树,从而获得决策规则。实例表明该方法是有效的,生成的决策规则简单,且具有较高的精确度。  相似文献   

4.
基于粗糙集的区间值属性决策表的有序规则获取   总被引:3,自引:0,他引:3  
提出一种基于粗糙集的区间值属性决策表的有序规则获取方法。首先根据区间数之间基于可能度的序关系,将区间值属性决策表转化为二元决策表,然后利用粗糙集理论进行分析并推理出最优规则,最后再将二元决策表的规则转化为区间值属性决策表的有序规则。实验分析表明了该方法的有效性。  相似文献   

5.
对目前求不一致决策表最简规则方法存在的问题进行了分析,提出了一种构造区分矩阵的方法,能更好地适用于多决策属性存在的决策表中.借助区分矩阵进行值约简,提出了一种新的规则提取算法.利用属性的重要度来描述条件属性所提供的知识对决策表的影响程度,引入规则准确度来衡量算法是否造成决策表的新的不一致规则.该算法不会破坏决策系统中一致规则和不一致规则所蕴含的信息量,保持约简前后规则的准确度不变.  相似文献   

6.
考虑到模糊信息系统的不完备性和信息值的不确定性,讨论了不完备区间值模糊信息系统的粗糙集理论,给出了粗糙近似算子的性质。研究了不完备区间值模糊信息系统上的知识发现,提出了基于不完备区间值决策表的决策规则和属性约简,最后给出算例。  相似文献   

7.
基于扩展粗糙集模型的集值不完备信息系统决策研究   总被引:1,自引:0,他引:1  
在客观世界中信息系统往往是不完备的。该文将粗糙集模型经过扩展后应用于属性值为集合值的不完备信息系统,给出了几种不同的上下近似集定义,着重建立和分析了一种不完备决策表,研究了对应的粗糙集模型扩展后的属性约简的方法,并根据约简生成了决策规则。  相似文献   

8.
纪霞  李龙澍 《控制与决策》2013,28(12):1837-1842

提出一种基于属性分辨度的不完备决策表规则提取算法, 它是一种例化方向的方法. 首先从空集开始, 逐步 选择当前最重要的条件属性对对象集分类, 从广义决策值唯一的相容块提取确定规则, 从其他的相容块提取不确定 规则; 然后设计属性必要性判断步骤去除每条规则的冗余属性; 最后通过规则约简过程来简化所获得的规则, 增强规 则的泛化能力. 实验结果表明, 所提出的算法效率更高, 并且所获得的规则简洁有效.

  相似文献   

9.
为有效地处理具有遗漏型未知属性值的不完备序信息系统,提出扩展序关系的概念,将不完备序信息系统转换为扩展序值矩阵.分析讨论扩展序值矩阵中粒计算模型和粒度度量方法,尝试在不改变不完备序信息系统中扩展序关系的前提下,从核属性集出发,结合启发式约简思路提出一种新的基于粒计算的不完备序决策表约简算法.实例验证表明,该方法能有效地从不完备序决策表中获取最小相对约简.  相似文献   

10.
张姣  曾艳燕  王驹  徐章艳 《计算机工程》2012,38(19):179-182,187
在不完备决策表中对求核算法的研究较少,且时间复杂度都相对较高.为此,根据不完备决策表中差别矩阵及其核的定义,给出条件属性的区分对象对集的定义,并得出其与决策表核属性的关系,从理论上证明求解不完备决策表的核可以转化到求条件属性的区分对象对集上.结合不完备决策表差别矩阵核的性质,提出一种基于区分对象对集的不完备决策表求核算法.实验结果表明,该算法的时间复杂度优于同类算法的时间复杂度.  相似文献   

11.
In this paper we propose a method of extracting rules in Incomplete Information System based on an irregular decision table. Need not to make estimation of missing attribute value, we get the rule set contains no missing attribute value. The experiment justify, the accuracy of obtained rule set is almost same with the highest accuracy among those of the estimating missing attribute value methods.  相似文献   

12.
基于改进遗传算法的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
属性约简是粗糙集理论研究的主要内容之一,为了能够有效地获取决策表中属性最小约简,在分析属性约简的方法与遗传算法的基础上,将属性重要性度量作为启发式信息引入遗传算法,提出了一种启发式遗传算法.通过构造新的变异算子来引入启发式信息,体现了启发式信息的局部搜索技术,使得算法既保持整体优化特性,又具有较快的收敛速度.实验结果表明,该方法能快速有效地求出决策表的最小约简.  相似文献   

13.
基于二进制可辨矩阵的决策规则约简算法   总被引:2,自引:1,他引:1       下载免费PDF全文
决策规则的约简是利用决策逻辑分别消去每一条决策规则中的冗余属性值,是粗糙集理论知识约简的重要内容,一般是在属性约简之后采用启发式信息实现决策规则的约简。基于二进制可辨矩阵给出一个简单的直接求取决策规则核的方法,并提出一种决策规则的约简算法。所给算法简单直观,不但适用于相容决策表,也适用于不相容的决策表。  相似文献   

14.
一种基于Rough集理论的属性约简启发式算法   总被引:9,自引:1,他引:9  
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中属性的最小相对约简,在Rough集理论的基础上构造了一个新的算子,将信息论角度定义的属性的重要性作为启发式信息,来描述在决策表中条件属性所提供的知识对决策属性的影响;并采用宽度优先搜索策略,提出了一种新的属性约简启发式算法.以原始条件属性集为起点并结合算子,通过向属性核的递减式逼近,得到属性的最小相对约简.实例分析表明,该算法能有效地对决策表属性进行约简.  相似文献   

15.
求解决策表的最小约简已被证明是NP-hard问题,在粗糙集和证据理论的基础上提出了一种知识约简的启发式算法。利用粗糙集等价划分的概念给出属性的信息熵,定义每个属性的熵值重要性并由此确定知识的核。引入二分mass函数对每个属性建立一个证据函数,证据融合得到每个属性的证据重要性。以核为起点,以证据重要性为启发,依次加入属性直至满足约简条件。实例表明,该方法能够快速找到核和相对约简,并且该约简运用到分类上正确率也是较高的。  相似文献   

16.
通过分析目前信息观下不完备信息系统属性约简,针对已提出的几种信息熵存在随着属性的增加系统分类能力减弱的不足,从条件属性确定的容差类在决策属性划分上的分布出发,给出不完备决策表的条件分布信息量的定义;同时,定义了新的属性重要度,并以此为启发信息设计属性约简算法。通过实验说明了该算法对不完备决策表属性约简是可行的。  相似文献   

17.
周亮  晏立 《计算机应用研究》2010,27(8):2899-2901
为了克服现有决策树分类算法在大数据集上的有效性和可伸缩性的局限,提出一种新的基于粗糙集理论的决策树算法。首先提出基于代表性实例的原型抽象方法,该方法从原始数据集中抽取代表性实例组成抽象原型,可缩减实例数目和无关属性,从而使算法可以处理大数据集;然后提出属性分类价值量概念,并作为选择属性的启发式测度,该测度描述了属性对分类的贡献价值量的多少,侧重考虑了属性之间以及实例与分类之间的关系。实验表明,新算法比其他算法生成的决策树规模要小,准确率也有显著提高,在大数据集上尤为明显。  相似文献   

18.
一种基于粗糙集理论的规则提取方法   总被引:3,自引:1,他引:2  
规则提取是实现智能信息系统的重要环节,也是一个难点。针对信息系统中的规则提取问题,提出了一种基于粗糙集的研究方法,并对规则提取涉及到的属性约简、属性值约简等问题进行了研究。根据粗糙集中的不可分辨关系建立了可辫识向量,以利用可辨识向量的加法法则运算求得核属性以及属性重要性,然后以核属性为基础、属性重要性为启发信息,求得信息表的一个属性约简。在此基础上,利用条件属性与决策属性之间的对应关系,对信息表中的每条规则通过删除冗余属性值来完成信息表的属性值约简,最终实现规则提取。数值实例和试验表明本算法是有效、可行的。  相似文献   

19.
从一种扩展的信息观的角度出发,讨论了Rough集理论的信息论观点。提出了一种基于扩展的信息熵的决策表核属性计算算法.并设计了以属性重要性为启发信息的自下而上的决策表属性约简算法EIEAAR。同时针对不一致表,将属性对不相客对象的包含值作为第二标准选择属性以加快约简速度。EIEAAR算法能处理一致和不一致决策表,并将核属性计算和非核属性约简统一起来。最后,对算法进行复杂度分析并用实例验证算法的有效性。实验表明该算法能有效得到决策表的最小约简。  相似文献   

20.
针对决策树C4.5算法在处理连续值属性过程中时间复杂度较高的问题,提出一种新的决策树构建方法:采用概率论中属性间的相关系数(Pearson),对数据集中的属性进行约简;结合属性的信息增益率,保留决策属性的最优子集,保证属性子集中没有冗余属性;采用边界点的判定,改进了连续值属性离散化过程中阈值分割方法,对信息增益率的计算进行修正。采用UCI数据库中的数据集,在Pycharm平台上进行一系列对比实验,结果表明:采用改进后C4.5决策树算法,决策树生成效率提高了约50%,准确率提升约2%,比较有效地解决了原C4.5算法属性选择偏连续值属性的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号