共查询到20条相似文献,搜索用时 156 毫秒
1.
2.
基于Rough Set理论的一种属性值约简算法 总被引:2,自引:0,他引:2
属性值的约简是Rough Set理论的核心内容之一。它的口的就是在保持规则集的分类能力的条件下,删除多余属性值,进一步简化规则集。从而,得到最小的知识库。本文针对Rough Set理论中值约简这个重要问题进行了研究,提出了一种利用决策规则质量的属性值约简算法。该算法比现有的值约简算法更简化,并用实验证明了其有效性。 相似文献
3.
主要对Rough Set理论中的离散化问题进行了研究,提出了基于属性值重要性的离散化算法,利用文献[5]中不可分辩类的定义、属性重要性的讨论及属性约简的启发式算法,得到了一种离散化与属性约简相结合的启发式算法,并通过Delphi程序验证了该算法对UCI数据库的有效性。 相似文献
4.
5.
一种属性与值约简简化算法 总被引:8,自引:0,他引:8
Rough Set理论是处理不确定性知识、不完整数据的重要工具,在Rough Set中属性最小约简与规则提取NP—hard的.本文针对现有属性约简与值约简算法的问题,分析了区分矩阵的特性,在此基础上,提出了属性与值约简的简化算法,并用实例作了验证. 相似文献
6.
一种改进的快速数据离散化算法 总被引:1,自引:0,他引:1
提出一种新的基于粗糙集理论的快速数据离散化算法FRSBD(Fast Rough Set based Discretization Algorithm),文章定义了属性决策关系矩阵等概念.证明了一组基于属性决策关系矩阵的断点判定规则的有效性,并基于该新的断点判定规则,实现了决策表中连续属性值的快速离散化.理论分析说明了FRSBD的正确性和有效性,仿真结果表明该算法优于文献报道的同类算法. 相似文献
7.
决策表在决策应用中起着重要作用,它指当满足某些条件时,决策(行为)应如何进行,但表中往往存在许多冗余信息,需要找到并去除它们。本文利用Rough Set理论中关于核的概念,给出了一种求最少属性及最少属性值(即核值表)的算法,从而得到最简决策表,同时也得到了最简分类规则。 相似文献
8.
9.
10.
设计简洁的切实可行的基于Rough Set的属性约简的算法.通过基于Rough Set的属性约简方法对两个实际应用说明了如何利用该方法计算条件属性相对于决策属性的重要度,去除冗余属性,形成新的精简的知识发现属性集,从而提高数据挖掘效率. 相似文献
11.
一种粗糙集属性约简算法 总被引:15,自引:5,他引:15
该文针对RoughSet理论的属性约简进行了研究。利用RoughSet和信息论的相关知识,研究了通过可辨识矩阵求得属性约简集,并利用条件熵来计算属性约简集中属性间的相关性,其平均值最小的属性集即为求得的最佳属性约简的结果。实验证明,它可以取得比较理想的效果。最后利用该文的方法给出了对UCI机器学习数据库的例子的约简结果。 相似文献
12.
在销售决策支持系统中,存在着大量的信息和很多不确定的因素,这使得做出科学合理的决策变得很困难。粗糙集理论是处理不确定性知识与不完整数据的有效工具,因此可以根据粗糙集理论通过分析推理找出销售数据中存在的有用的知识。依据粗糙集理论实现了一种对销售决策表知识简化的方法,采用粗集理论处理大量销售信息,从中提取有用规则,通过分析和推理产生最小决策规则。通过实例分析,验证了粗糙集理论与销售决策支持系统相结合方法的可行性。该方法有效地解决了智能销售决策支持系统中决策规则的获取与理解等问题。 相似文献
13.
粗糙集用属性所构建的信息系统来描写事物,用各种细化的熵指标来实现信息的标度,为挖掘知识的关系数据库提供了数学基础,当前人们最关注的是她在属性约简中所能发挥的作用。但是它用以约简的区分函数定义不清楚,当没有属性能区分两个对象时,相应的属性变量为什么不取0而是取1?这一问题成为粗糙集应用的一个瓶颈。本文的目的是要为区分函数寻找更合理的解释和运用。所采用的方法是,首先要对属性名之间的运算要下定义,属性名与属性值不同,如果用属性值的运算来代替属性名的运算,就会在理解上出现混乱。为此,我们用因素空间的理论,将属性名视为因素,用因素之间的运算来定义属性名的运算,使区分函数有了明确的定义,同时也清楚解释了属性变量在特殊情况下为何取1的问题。这一结果说明因素空间可以加深粗糙集的理论基础,提高其解决问题的能力。 相似文献
14.
本文就粗糙集理论及其在数据挖掘中的应用方法进行了较为深入系统地研究。重点研究了扩展粗糙集模型;基于连续属性的粗糙集模型及其约简算法;不完备信息系统下粗糙集模型及其约简算法;以及更一般的集值信息系统及其约简算法。 相似文献
15.
本文就粗糙集理论及其在数据挖掘中的应用方法进行了较为深入系统地研究。重点研究了扩展粗糙集模型;基于连续属性的粗糙集模型及其约简算法;不完备信息系统下粗糙集模型及其约简算法;以及更一般的集值信息系统及其约简算法。 相似文献
16.
17.
粗糙集与泛系理论相结合已成为一个新兴的研究领域,基于泛系理论中的泛权场/网等理论,对粗糙集理论的基本概念进行了基本的概括和扩展,将粗糙集理论泛系化扩展加以研究,进而构建了粗糙集的泛系化扩展模型,并通过实例给予解释,为粗糙集的进一步完善和扩展找到了一条新路。 相似文献
18.
本文主要介绍了用VisualBasic和SQLSever开发的小儿常见病诊断智能超媒体系统以及RoughSet理论在该系统中的应用,包括利用RoughSet理论对该系统中的知识库中的知识进行约简和进行正推理和反推理的方法。RoughSet理论的应用,大大提高了该系统的推理效率。 相似文献
19.
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,节点划分属性选择的度量直接影响决策树分类的效果。基于粗糙集的属性频率函数方法度量属性重要性,并用于分枝划分属性的选择和决策树的预剪枝,提出一种决策树学习算法。同时,为了能处理数值型属性,利用数据集的统计性质为启发式知识,提出了一种改进的数值型属性信息熵离散化算法。实验结果表明,新的离散化方法计算效率有明显提高,新的决策树算法与基于信息熵的决策树算法相比较,结构简单,且能有效提高分类效果。 相似文献
20.
变精度粗集模型在决策树生成过程中的应用 总被引:2,自引:0,他引:2
Pawlak粗集模型所描述的分类是完全精确的,而没有某种程度上的近似。在利用Pawlak粗集模型构造决策树的过程中,生成方法会将少数特殊实例特化出来,使生成的决策树过于庞大,从而降低了决策树对未来数据的预测和分类能力。利用变精度粗集模型,对基于Pawlak粗集模型的决策树生成方法进行改进,提出变精度明确区的概念,允许在构造决策树的过程中划入明确区的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力。 相似文献