共查询到18条相似文献,搜索用时 125 毫秒
1.
一种基于Rough集的缺省规则挖掘算法 总被引:22,自引:1,他引:21
Rough集方法是一种处理不确定或模糊知识的重要工具,对基于Rough集理论的缺省规则挖掘算法进行研究,在引入规则支持度概念后,提出了一种基于Rough集的缺省规则挖掘算法MDRBR。实验结果表明,该算法能较好地过滤噪音,提高规则的挖掘效率。 相似文献
2.
3.
基于缺省规则的决策支持方法 总被引:2,自引:0,他引:2
利用Rough集理论的基本原理和方法,在提出一种缺省规则挖掘策略和算法的基础上,系统地描述了基于缺省规则的决策支持方法,将其应用于汽车故障诊断决策分析中.试用表明,该方法能较好地排除噪声的影响,使决策者在有限的时间和有限的知识下,作出比较合理的决策. 相似文献
4.
Rough集理论提供了一种新的处理不精确、不完全与不相容知识的数学方法。从不一致决策表中快速、有效地挖掘出缺省规则是决策规则挖掘研究的一个热点。该文改进了MDRBR算法,引入了广义支持度概念,并提出了一种基于多元组决策表的缺省规则挖掘算法-MTMDRBR算法,有效地解决了不一致多元组决策表的缺省规则挖掘问题,具有重要的实用意义。 相似文献
5.
Rough集理论提供了一种新的处理不精确、不完全与不相容知识的数学方法。从不一致决策表中快速而有效地挖掘出缺省规则是决策规则挖掘研究的一个热点。MDRBR算法采用单一的规则支持度阈值进行缺省规则的挖掘,这不利于有效地挖掘出用户感兴趣的缺省规则。为此,该文对MDRBR算法进行了改进,并提出了一种基于多重支持度的的缺省规则挖掘算法-MSMDRBR算法,MSMDRBR算法可依据多重支持度阈值合理地取舍决策规则,因而具有一定的实用意义。 相似文献
6.
基于时间序列的电力系统故障诊断规则挖掘 总被引:1,自引:0,他引:1
介绍了利用Rough集理论进行数据挖掘技术在电力系统故障诊断中的应用。针对电力系统中与时间序列相关的数据集,提出了基于Rough集的时间序列相关的分类规则挖掘算法。利用该算法得到的分类规则,可以较好地反映条件属性集随时间动态变化对系统状态的影响。 相似文献
7.
属性渐增式的决策规则挖掘算法 总被引:1,自引:0,他引:1
1引言
在数据挖掘(Data Mining)中,决策规则的挖掘是一个重要的目标,其描述了个体的属性之间的一种依赖关系[1].A.Skowron和C.Rausser在Rough集理论[1]的基础上提出了分明矩阵(Discernibilitymatrix)和分明函数(Discernibility function)的概念之后[2],基于Rough集理论的数据挖掘的研究方法大多是遵循这两个概念的,诸如:信息系统中属性依赖关系的挖掘[3],决策规则的生成[4],数据浓缩[5],属性的约简(Reduciton)[4,6]等. 相似文献
8.
基于信息增益的最佳属性集发现方法 总被引:7,自引:0,他引:7
怎样挖掘出简洁、紧凑、易于理解和有效的分类规则一直是研究人员和领域专家所面临的问题 .而通过发现最佳属性集是解决该问题的一种有效途径 .本文在 Rough集理论的基础上 ,将单属性信息增益概念扩充为多属性的情况 ,并引入到最佳属性的发现中 .实验表明 ,该算法能够挖掘出简洁易于理解和使用的规则 ,并且具有较高的分类能力 相似文献
9.
Rough集理论是对大型数据库进行知识发现的主要方法之一。根据属性集核和相对等价类的概念,对数据库属性集中的属性进行约简,提取相应的规则(知识),是用Rough集知识发现的精髓。该文基于Rough集差别矩阵,提出了属性集的布尔函数的构造方法,并应用吸收律、分配律和等幂律对属性集布尔函数化简。论文证明了属性集布尔函数的化简与属性集的差别矩阵约简等价,同时给出了求相对决策属性基本集的算法和IRIS提供的数据仿真实验结果。 相似文献
10.
Rough集理论是近年来发展起来的一种有效地处理不精确、不确定、含糊信息的数学理论方法,在机器学习、数据挖掘、智能数据分析、控制算法获取等领域取得了很大的成功.决策表是Rough Set理论的处理对象,用RoughSet对决策表进行规则提取通常有代数观和信息观两种主要理论和方法.使用哪一种方法提取的规则集更好是很多研究者的目标.本文针对Rough Set理论的核心内容之一的知识获取进行了研究,提出了一种基于属性重要性排序的知识获取算法,并且证明了在不相容系统中使用信息观方法比使用代数观的方法更好,能够提取更合理的规则集. 相似文献
11.
粗糙集理论是一种进行数据挖掘的新的重要工具。针对传统粗糙集理论在数据挖掘应用方面的不足提出了有效度(可靠度)的概念,并给出了一种关于有效决策的增式生成法。实例表明,该算法具备处理大数据库和动态递增数据的功能,可有效地过滤噪声,提高了规则的挖掘效率。 相似文献
12.
一种基于Web用户不完备信息的规则获取方法研究 总被引:1,自引:0,他引:1
Web日志是一个很不完全且存在多样性特点的数据集,在获取决策规则的过程中经常会出现不一致、不完全规则的情况.提到了粗糙集理论,利用粗糙集理论在处理不完全知识上的特有优势来解决此种问题.首先把重要的用户行为特征值离散化作为属性值和值的约简,然后通过粗糙集缺省规则获取算法获得决策规则.其中条件属性的提取主要是一个对用户行为观察和分析的结果,而离散化处理方法就是应用粗糙集理论中的典型方法.这种处理方法有利于最后规则提取的进行,经过实例分析效果良好. 相似文献
13.
经典Rough集理论是基于完备信息系统的。然而在实际应用中,由于数据存取或数据处理方面的原因,决策表经常是不完备的,即存在缺值。为了处理不完备信息系统,Kryszkiewicz提出了基于容差关系的Rough集模型。在该模型下进行知识约简时,现有的算法一般都采用构造区分矩阵和相应区分函数的方法。该方法虽然可以求得所有约简,然而业己证明这是一个NP-hard问题,因此实践中更为可行的方法是利用启发式搜索算法求出最优或次最优约简。在文中提出属性的重要性定义,并以此作为启发式信息,设计一种完备的知识约简算法。 相似文献
14.
15.
16.
近年来粗糙集数据分析已经成为定性数据分析的一个常用方法,而信息系统的属性约简是粗糙集理论的一个基本问题.粗糙集方法虽然不需要数据之外的其它信息,但所得结果同时也缺乏统计证据.文中运用非参数统计的思想研究了信息系统的属性约简问题,首先将原始信息系统整理成任意两个属性子集之间的列联表,然后给出了基于卡方统计量的属性相关性的一个新度量,基于此度量给出了信息系统属性约简的新方法.数值例子说明了该方法的可行性和有效性. 相似文献
17.
特征选择在文本分类中起重要的作用。文档频率(DF)、信息增益(IG)和互信息(MI)等特征选择方法在文本分类中广泛应用。已有的实验结果表明,IG是最有效的特征选择算法之一,该方法基于申农提出的信息论。本文基于粗糙集理论,提出了一种新的特征选择方法(KG算法),该方法依据粗糙集理论关于知识的观点,即知识是分类事物的能力,将知识进行量化,提出知识增益的概念,得到基于知识增益的特征选择方法。在两个通用的语料集OHSUMED和NewsGroup上进行分类实验发现KG算法均超过IG的性能,特别是在特征空间的维数降到低维时尤其明显,可见KG算法有较好的性能; 相似文献