共查询到19条相似文献,搜索用时 93 毫秒
1.
将Rough集理论应用于规则归纳系统,提出了一种基于粗糙集获取规则知识库的增量式学习方法,能够有效处理决策表中不一致情形,采用启发式算法获取决策表的最简规则,当新对象加入时在原有规则集基础上进行规则知识库的增量式更新,避免了为更新规则而重新运行规获取算法。并用UCI中多个数据集从规则集的规则数目、数据浓缩率、预测能力等指标对该算法进行了测试。实验表明了该算法的有效性。 相似文献
2.
3.
一种增量式规则提取算法 总被引:6,自引:0,他引:6
扩展了决策矩阵的定义,并在此基础上提出一种增量式规则提取算法(IREA),该算法能够以增量的方式从样本数据中提取确定性和可能性规则.对于缺乏领域知识时的知识/规则获取具有重要使用价值. 相似文献
4.
5.
从粗糙集理论出发,利用决策表局部最小确定性作为阈值来自主控制产生规则,得到一种改进的增量式学习算法.实验表明,在处理大多数数据集时,该算法效率和生成的规则集对样本的正确识别率都较已有的基于粗糙集的增量式算法IRAA有所提高. 相似文献
6.
基于Rough Set理论的增量式规则获取算法 总被引:3,自引:0,他引:3
从Rough set理论出发,讨论在新增数据时,新数据与已有规则集的关系、属性约简以及值约简的变化规律.并在此基础上提出一个新的基于Rough Set理论的增量式算法.从理论上和实验上对新算法和传统算法在算法复杂度上做了分析与比较. 相似文献
7.
8.
基于决策熵的决策树规则提取方法 总被引:2,自引:0,他引:2
在决策表中,决策规则的可信度和对象覆盖度是衡量决策能力的重要指标。以知识粗糙熵为基础,提出决策熵的概念,并定义其属性重要性;然后以条件属性子集的决策熵来度量其对决策分类的重要性,自顶向下递归构造决策树;最后遍历决策树,简化所获得的决策规则。该方法的优点在于构造决策树及提取规则前不进行属性约简,计算直观,时间复杂度较低。实例分析的结果表明,该方法能获得更为简化有效的决策规则。 相似文献
9.
在多标记决策系统中,每个对象由单个实例进行表示,同时对应于多个决策属性。粗糙集理论已有的研究工作主要集中在单一决策系统的研究上,对于多决策系统只是简单地将它分解成多个单一决策系统。直接变换的方法忽视了决策属性之间的相关性和共现性,影响决策的精度。基于粗糙集模型,分别针对属性值为离散型和连续型的情况,提出了离散型多标记决策系统知识获取算法DML和连续型多标记决策系统知识获取算法CML。这两种算法均考虑了标记之间的相关性,在离散多标记决策系统中,采用决策链方式传递属性间的相关性,而在连续多标记决策系统中,扩展了传统粗糙集模型,重新定义了粗糙近似。实验表明,不论是离散型还是连续型决策系统,考虑决策属性之间的相关性均可以提高预测的准确率。 相似文献
10.
在决策表中,决策规则的可信度和对象覆盖度是衡量决策能力的重要指标。以知识粗糙熵为基础,提出决策熵的概念,并定义其属性重要性;然后以条件属性子集的决策熵来度量其对决策分类的重要性,自顶向下递归构造决策树;最后遍历决策树,简化所获得的决策规则。该方法的优点在于构造决策树及提取规则前不进行属性约简,计算直观,时间复杂度较低。实例分析的结果表明,该方法能获得更为简化有效的决策规则。 相似文献
11.
12.
对决策表各条件分类和决策分类集合之间的关系进行了研究,提出了直接从各分类中计算决策表核及属性约简方法:依据属性约简,创建了一个多变量决策树;在此基础上,阐述了提取决策表中蕴含规则的方法,从而省去了在约简后的决策表中计算值约简步骤;通过实例,验证了这些方法的有效性。 相似文献
13.
基于新的条件熵的决策表约简方法 总被引:2,自引:0,他引:2
分析了在知识约简过程中现有条件熵的不足,在一致和不一致对象分开的基础上,定义了一种新的条件熵概念,以弥补现有信息熵的不足,在此基础上给出了以不等式为条件的约简判定定理;然后以条件属性子集的条件熵来度量其对决策分类的重要性,提出了一种新的知识约简启发式方法.应用实例分析的结果表明,基于新的条件熵的属性重要性是一种更准确、更有效的启发式信息,该方法时间复杂度较低,有助于搜索最小或次优知识约简. 相似文献
14.
15.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的度量直接影响决策树分类的效果。基于粗糙集的属性频率函数方法度量属性重要性,并用于分枝划分属性的选择和决策树的预剪枝,提出一种决策树学习算法。同时,为了能处理数值型属性,利用数据集的统计性质为启发式知识,提出了一种改进的数值型属性信息熵离散化算法。实验结果表明,新的离散化方法计算效率有明显提高,新的决策树算法与基于信息熵的决策树算法相比较,结构简单,且能有效提高分类效果。 相似文献
16.
分布式知识获取是当前数据挖掘研究领域的热点问题之一.为了利用Rough集理论荻取分布决策表中的知识,提出了一个基于Rough集理论的分布式知识获取模型,并讨论了数据在粗糙分布式环境下,运用信息抽取算子及知识生成算子获取全局决策规则的方法.这些理论与方法扩展了Rough集理论处理多数据源的知识获取问题.实例证明了这些方法的可行性. 相似文献
17.
18.
针对静态算法对大数据和增量数据处理不足的问题,构造了基于粗决策树的动态规则提取算法,并将其应用于旋转机械故障诊断中.将粗集与决策树结合,用增量方式实现样本抽取;经过动态约简、决策树构造、规则提取与选择、匹配4个步骤的循环迭代过程,实现了数据的动态规则提取,使得提取的规则具有更高的可信度;同时,将算法应用于旋转机械故障诊断这一动态问题中,验证了算法的有效性;最后,将所提算法分别与静态算法和增量式动态算法进行了效率对比分析,实验结果表明,所提算法能够以最精简的规则获得更多数据隐含信息. 相似文献
19.
基于粗糙集和决策树的增量式规则约简算法 总被引:2,自引:0,他引:2
粗糙集方法是一种处理不确定或模糊知识的重要工具。传统的粗糙集模型对最简规则集的研究都是针对静态数据的,对于动态数据却显得无能为力。但在实际应用中,数据库中的数据往往是动态变化的,因此,对规则约简的增量式算法的研究是知识发现领域所急需解决的问题之一。文章给出了一种基于粗糙集和决策树的增量式规则约简算法,并与传统算法和RRIA算法进行了对比分析,实验结果表明该算法的方法和效果更好。 相似文献