首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一种基于Rough Set理论的属性约简及规则提取方法   总被引:132,自引:1,他引:132  
常犁云  王国胤  吴渝 《软件学报》1999,10(11):1206-1211
该文针对Rough Set理论中属性约简和值约简这两个重要问题进行了研究,提出了一种借助于可辨识矩阵(discernibility matrix)和数学逻辑运算得到最佳属性约简的新方法.同时,借助该矩阵还可以方便地构造基于Rough Set理论的多变量决策树.另外,对目前广泛采用的一种值约简策略进行了改进,最终使得到的规则进一步简化.  相似文献   

2.
一种属性与值约简简化算法   总被引:8,自引:0,他引:8  
Rough Set理论是处理不确定性知识、不完整数据的重要工具,在Rough Set中属性最小约简与规则提取NP—hard的.本文针对现有属性约简与值约简算法的问题,分析了区分矩阵的特性,在此基础上,提出了属性与值约简的简化算法,并用实例作了验证.  相似文献   

3.
基于RoughSet理论,研究从Skrowon分辨矩阵到规则自动生成过程中的关键算法的改进问题。提出由分辨矩阵到合取项矩阵的计算方法,建立了从属性约简的合取项矩阵到析取项矩阵转换的数学模型,基于数学模型,提出直接搜索的转换方法。同时,提出了属性值约简的改进方法,使得改进后的算法从总体上节省了运算空间,降低了算法的时间复杂性,提高了规则生成的效率。最后通过UCI数据库的实例验证了改进算法的有效性。  相似文献   

4.
核属性蚁群算法的规则获取   总被引:1,自引:0,他引:1  
蚁群算法是一种新型的模拟进化算法,研究已经表明该算法具有许多优良的性质,并且在优化计算中已得到了很多应用.粗糙集理论作为一种智能数据分析和数据挖掘的新的数学工具,其主要优点在于它不需要任何关于被处理数据的先验或额外知识.本文从规则获取和优化两方面研究基于粗糙集理论和蚁群算法的分类规则挖掘方法.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识理论,将粗糙集理论与蚁群算法融合,采用粗糙集理论进行属性约简,利用蚁群算法获取最优分类规则,优势互补.实验结果比较表明,算法获取的分类规则,具有良好的预测能力和更为简洁的表示形式.  相似文献   

5.
Abstract

The problem of knowledge acquisition has been recognized as the major bottleneck in the development of knowledge-based systems. An encouraging approach to alleviate this problem is inductive learning. Inductive learning systems accept, as input, a set of data that represent instances of the problem domain and produce, as output, the rules of the knowledge base. Each data item is described by a set of attribute values and is assigned to a unique decision class. A common characteristic of the existing inductive learning systems, is that they are empirical in nature and do not take into account the implications of the inductive rule generation process on the performance of the resulting set of rules. That performance is assessed when the rules are used to classify new unlabelled data. This paper demonstrates that the performance of a rule set is a function of the rule generation and rule interpretation processes. These two processes are interrelated and should not be considered separately. The interrelation of rule generation and rule interpretation is analysed and suggestions to improve the performance of existing inductive learning systems, are forwarded.  相似文献   

6.
Most previous studies on rough sets focused on attribute reduction and decision rule mining on a single concept level. Data with attribute value taxonomies (AVTs) are, however, commonly seen in real-world applications. In this paper, we extend Pawlak’s rough set model, and propose a novel multi-level rough set model (MLRS) based on AVTs and a full-subtree generalization scheme. Paralleling with Pawlak’s rough set model, some conclusions related to the MLRS are given. Meanwhile, a novel concept of cut reduction based on MLRS is presented. A cut reduction can induce the most abstract multi-level decision table with the same classification ability on the raw decision table, and no other multi-level decision table exists that is more abstract. Furthermore, the relationships between attribute reduction in Pawlak’s rough set model and cut reduction in MLRS are discussed. We also prove that the problem of cut reduction generation is NP-hard, and develop a heuristic algorithm named CRTDR for computing the cut reduction. Finally, an approach named RMTDR for mining multi-level decision rule is provided. It can mine decision rules from different concept levels. Example analysis and comparative experiments show that the proposed methods are efficient and effective in handling the problems where data is associated with AVTs.  相似文献   

7.
现实生活中许多数据库都是动态变化的,为了获取新的知识,传统的方法需要重复计算,耗时巨大。为了克服这个缺陷,有效处理动态数据,许多学者提出了增量学习方法。针对决策表属性值动态变化,提出了基于属性值细化的矩阵增量约简算法,当一部分属性值被细化时,同非增量约简方法相比,增量方法能快速找到新的约简,最后通过UCI数据进行性能测试,实验仿真结果表明所提增量约简算法是有效的。  相似文献   

8.
一种不完备信息系统的直接约简方法   总被引:9,自引:1,他引:9  
目前已有基于容差关系、相似关系、限制容差关系等的扩充rough集理论,但仅仅是提出了一些针对以上某种模型的属性约简算法,在此提出从离散化到规则匹配的一系列不完备信息系统的约简处理方法,该方法可以适用于各种rough集扩充模型,并且对完备信息系统和不完备信息系统是统一的.  相似文献   

9.
传统的粗糙集理论主要是针对单层次决策表的属性约简和决策规则获取研究.然而,现实中树型结构的属性值分类是普遍存在的.针对条件属性具有属性值分类的情况,结合全子树泛化模式,提出一种多层次粗糙集模型,分析决策表在不同层次泛化空间下相关性质.结合基于正区域的属性约简理论,提出属性值泛化约简概念讨论二者之间的关系,同时证明求解泛化约简是一个NP Hard问题.为此,提出一种基于正区域的的启发式泛化约简算法,该算法采用自顶向下逐步细化搜索策略,能够在保持原始决策表正区域不改变的前提下,将决策表所有属性值泛化到最佳层次.理论分析和仿真实验表明,泛化约简方法能提高知识发现的层次和泛化能力.  相似文献   

10.
形式概念分析的属性约简是知识表达和数据处理的一种有力的工具。对于不协调决策形式背景,已有多种属性约简的方法。从布尔矩阵运算的角度研究不协调决策形式背景的属性约简问题,提出属性约简的新的刻画。首先,借助矩阵的运算给出广义矩阵协调集的定义,并研究属性之间相似性的度量。接着,针对在属性约简过程中起不同作用的属性,将条件属性区分为核心属性和非核心属性,提出一个属性是否是核心属性的充要判断条件,以及得出属性约简的判别方法。最后,在此框架上设计出不协调决策形式背景属性约简的一种启发式算法,通过例题说明此算法的可行性和合理性。通过属性约简,该形式背景下的概念格计算更为简便。上述结果有助于进一步的应用及为研究形式概念分析的矩阵方法提供理论基础。  相似文献   

11.
曾小宁  肖水晶 《计算机应用》2007,27(6):1403-1406
引入扩展差别矩阵和扩展决策矩阵,提出了新的属性约简算法和增量更新算法,即基于扩展差别矩阵的属性约简算法和基于扩展决策矩阵的增量式规则提取算法,讨论了规则的增量更新算法。由于使用了增量更新算法和并行处理技术,从而提高了数据挖掘的效率,降低了时间复杂度。通过实验说明此算法是有效和可行的。  相似文献   

12.
基于分解合并策略的属性约简算法   总被引:1,自引:1,他引:0       下载免费PDF全文
在基于粗集理论的知识获取研究中,属性约简是最核心的工作之一。结合分治法的思想,从论域划分的角度将一个大的决策表分解成两个子决策表,并利用经典的属性约简算法计算两个子决策表的约简,在此基础上利用合并约简算法将这两个子决策表合并,并求出原问题的解。该方法为解决大数据集的属性约简提供了一个新的途径。实验说明了算法的有效性。  相似文献   

13.
基于属性相关性的决策树规则生成算法   总被引:5,自引:0,他引:5  
范洁  常晓航  杨岳湘 《计算机仿真》2006,23(12):90-92,103
决策树方法因结构简单、便于理解和具有较高的分类精度而在数据挖掘中被广泛采用,其规则生成算法实现对决策树规则的提取和化简。属性相关性分析的基本思想是计算某种度量,用于量化属性与给定概念的相关性。提出了一种基于属性相关性的c4.5决策树规则生成算法c—c4.5rules,可替代c4.5原有的规则生成算法。c—c4.5rules在对规则进行化简时充分考虑了属性之间的关联性,实验表明该算法在保持原有分类精度的前提下,能有效提高规则生成时的计算速度和效率。  相似文献   

14.
周军  林庆  胡瑞瑞 《计算机应用》2009,29(6):1608-1611
粗糙集理论在对不精确、不确定和不完全的数据进行分类分析和知识获取中具有突出的优势。从粒度粗细的角度动态分析了粗糙集的边界域,结合属性关联的理论定义了动态粒度商的概念。依据粒度粗细的理论,提出了一种新的属性约简算法。采用动态粒度商法选择最优归约集,抛弃了传统的先求核心,再选择最优归约集的算法。实例研究证明提出的粒度计算方法是可靠有效的,为进一步研究知识的粒度计算提供了可行的方法。  相似文献   

15.
针对基于决策形式背景进行属性约简与规则提取能够更便捷有效地获取知识,因此规则提取及属性约简是形式概念分析理论重要的研究课题。本文基于等价关系研究粒协调决策形式背景的属性约简与规则提取,定义粒协调集与粒约简,给出粒协调集判定定理,并结合布尔方法给出属性约简算法,最后利用集值向量包含度这一工具给出决策形式背景中的乐观规则融合方法与悲观规则融合方法。  相似文献   

16.
一种基于粗糙集理论的智能故障诊断新方法   总被引:4,自引:1,他引:4  
论文针对基于规则的故障源分离与定位方法中的一个关键问题,即诊断规则的获取,利用粗糙集的基本原理构造出了一种用于规则提取的新方法,其中包括了用于对故障决策表,即故障字典,进行属性约简的改进算法和属性值的顺序约简算法。该方法能够迅速从故障字典中提取出诊断规则,并揭示出故障信息内在的冗余性。最后实例应用的结果表明了该方法的有效性,尤其是在不完全信息情况下的有效性。  相似文献   

17.
针对多数属性约简算法在构造差别矩阵时会产生大量重复元素,并且在约简过程中需要频繁的对整个论域进行等价划分等弱点,对降低属性约简和规则生成的复杂度作了研究.利用基于等价类的差别矩阵进行属性重要性计算,从规则相容度的角度出发,提出了一种等价划分域动态缩减的属性约简算法.该算法提高了属性约简的效率,同时完成确定规则决策树的构造.最后给出了具体的实例.  相似文献   

18.
遗传算法适合复杂问题的处理因此可用于属性约简的求解.目前利用遗传算法进行属性约简的主要不足是:适应度函数计算复杂,效率不高.尤其在处理大型决策表时,计算时间将大量聚集在适应度函数的计算上,从而导致算法性能下降.为了更快的计算适应度函数,在研究基于正区域的区分对象对集的基础上,设计了一种计算适应度函数的快速方法.利用启发信息设计了一种快速的属性约简遗传算法.通过实例分析和算法实验表明该算法能够高效求出决策表的属性约简并且适合处理大型决策表.  相似文献   

19.
曾安  潘丹  郑启伦  彭宏 《计算机科学》2007,34(6):226-230
T细胞表位预测技术对于减少实验合成重叠肽、研究病原体与机体作用的免疫机制以及深入理解T细胞介导的免疫特异性均有重要意义。为增强T细胞表位预测模型的可理解性,本文在通过肽的预处理构建出存储等长肽段的决策表之后,设计出了一种基于粗集的T细胞表位预测方法。该方法由基于信息熵的属性约简完备算法和基于锚点知识的属性值顺序约简改进算法共同组成。基于HLA-DR4(B10401)编码的MHCII类分子结合肽的实验数据表明,在预测精度与传统神经网络方法大致相当的基础上,本文方法可以提取出用于帮助专家理解MHC分子与抗原肽结合机理的产生式规则。  相似文献   

20.
研究实值决策系统中的知识获取是粒计算研究的主要方向之一。为给出一种高效的知识获取方法,基于邻域粗糙集的原理,针对实值特点,在相容的实值决策系统中,给出判别度描述下的约简定义。进一步提出一种基于判别度的属性约简的启发式算法,同时对算法的性质进行了分析,通过实例验证了算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号