首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
提出了一种基于Rough集理论的Self集构造和演化算法。利用Rough集约简算法,对用户的安全访问行为的数据作规范化处理并进行约简,从中提取有效的最简规则,降低了安全数据的冗余,减轻了特征码构造的负担。使用Rough集上、下近似集原理,构造了上、下近似Self集,实现了Self的优化和扩展,有效地解决了Self集的自动演化问题。  相似文献   

2.
一种新的快速计算正区域的方法   总被引:26,自引:0,他引:26  
Rough集理论是一种新型的处理模糊性和不确定性知识的数学工具,正区域是该理论的核心概念之一,如何有效地计算正区域对提高各相关算法的性能至关重要.在对比Rough集理论进行深入研究的基础上,提出且证明了一种新的快速计算正区域的方法,并进一步分析了正区域的渐增式计算,最后给出了详细的算法描述和时间复杂度分析.理论分析和实验结果表明,该方法能够有效地降低计算复杂度,在效率上较现有的方法有显著提高.  相似文献   

3.
冗余数据约简的研究与设计   总被引:2,自引:0,他引:2       下载免费PDF全文
Z. Pawlak于1982年提出的Rough集理论有效地分析了不确定、不精确、不一致等各种不完备信息,其优点是无需任何关于数据的初始的或附加的信息,如统计学中的概率分布。该文介绍了Rough集的基本理论在数据约简中的应用。在分析基于信息系统的粗糙集理论的基础上,描述了一种基于核与重要度的约简算法,从降低约简算法计算复杂度角度出发,修改了属性约简算法,计算了算法修改前后的复杂度。实验结果表明,修改后的算法在降低时间复杂度的同时得出了次优属性集的约简。  相似文献   

4.
基于Rough集的数据约简算法研究综述   总被引:4,自引:0,他引:4  
介绍基于Rough集的数据约简的理论和它在应用理论研究上的新进展,综述基于Rough集的数据约简算法研究应用成果,并指出其应用前景和存在的问题。  相似文献   

5.
本文主要针对Rough集理论本身以及基于Rough集理论的信息表的约简方法进行研究。并在原有的Rough集理论关于信息表约简方法的基础上提出了一种新的信息表约简的方法-简单相异矩阵法。  相似文献   

6.
值约简是Rough集理论的一个重要研究课题。很多学者对它进行了研究并提出了不同的值约简算法,但是在执行效率上还有待提高。在启发式值约简算法基础上,结合属性值的重要性,提出了一种改进的基于属性值重要性的Rough集值约简算法,该算法在执行效率上有很大的提高,通过实例分析验证了该算法的可行性和有效性。  相似文献   

7.
基于属性值重要性的Rough集值约简算法   总被引:1,自引:0,他引:1  
值约简是Rough集理论的一个重要研究课题。很多学者对它进行了研究并提出了不同的值约简算法,但是在执行效率上还有待提高。在启发式值约简算法基础上,结合属性值的重要性,提出了一种改进的基于属性值重要性的Rough集值约简算法,该算法在执行效率上有很大的提高,通过实例分析验证了该算法的可行性和有效性。  相似文献   

8.
属性约简是Rough集理论的核心内容之一,计算所有的属性约简已经被证明是NP完全问题.在深入研究Rough集理论的基础上,仔细分析了对象集的增加与属性约简的关系,给出了增量式属性约简的判定定理,从而提供了计算所有属性约简的增量式算法,分析了算法的时间复杂度.理论分析和实验结果表明,该约简算法在效率上较现有的算法有显著提高.  相似文献   

9.
该文以Rough集数据分析技术(RSDA,RoughSetDataAnalysis)为基础,对关系数据库(RDB,relationaldatabase)和Rough集的关系进行了系统的研究。具体做法是,从Rough集与RDB产生的理论背景、关系与信息表的形式化语义、核心概念之间的关系、Rough度量与RRDM(roughrelationaldatabasemodel,简称RRDM)等方面对它们的关系进行了系统的、深入的探讨,并得出了相应的结论。  相似文献   

10.
Rough集高效算法的研究   总被引:166,自引:11,他引:166  
深入分析了现有Rough集算法低效性的根源,围绕不可区分关系和正区域两个核心概念,研究了不可区分关系的性质,给出并证明了正区域的一种等价计算方法,从而得出高效的Rough集基本算法;随后,分析了正区域的渐增式计算,并给出了一种完备的同性约简算法.理论分析和实验结果表明,该约简算法在效率上较现有的算法有显著提高.  相似文献   

11.
关于决策表约简的CEBARKNC算法改进   总被引:3,自引:0,他引:3  
CEBARKNC算法是基于条件信息熵的决策表约简算法,但是该算法对于某些决策表的约简是不完全的。通过对CEBARKNC算法的分析,找出该算法的约简不完全的原因,并讨论了启发信息的构造,进而在此基础上提出了以粗糙集的代数理论为基础,以条件信息熵为属性约简的启发式信息的改进算法。  相似文献   

12.
Rough set (RS) is a valid theory to deal with imprecise, uncertain, and vague information. It has been applied successfully since it was developed by Professor Z. Pawlak in 1982 in such fields as machine learning, data mining, intelligent data analyzing, control algorithm acquiring, etc. The greatest advantage of the RS is its great ability to compute the reductions of information systems. Many researchers have done a lot of work in developing efficient algorithms to compute useful reductions of information systems. There also are some researchers working on the relationship between rough entropy and information entropy. They have developed some efficient reduction algorithms based on conditional information entropy. In this article, the relationship of the definitions of rough reduction in algebra view and information view is studied. Some relationships such as inclusion relationship under some conditions and equivalence relationship under some other conditions are presented. The inclusion relationship between the attribute importance defined in algebra view and information view is presented also. Some efficient heuristic reduction algorithms can be developed further using these results. © 2003 Wiley Periodicals, Inc.  相似文献   

13.
从粒度计算的角度对粗糙集理论的属性约简进行研究,分别基于代数方法和信息论方法定义了粒度差和粒度熵的概念,并在此基础上提出了两种新的属性约简算法.实验分析表明,这两种可靠有效的粒度计算方法都能得到信息表的最小约简,为进一步研究知识的粒度计算提供了可行的方法.  相似文献   

14.
知识粗糙性和条件信息熵的关系   总被引:1,自引:0,他引:1       下载免费PDF全文
目前,粗糙集理论存在着两种观点,它们分别是代数观和信息观。在代数观点中,知识粗糙性体现了知识的粒度;而在信息观中,定义了知识的信息熵和条件信息熵。已经有定理证明了信息熵与知识的粗糙性存在对应关系,它建立了代数观和信息观之间的联系,但是这种关系却不是一一对应的。该文通过重新证明知识粗糙性和信息熵的对应关系定理,找到与知识粗糙性存在一一对应关系的是条件信息熵,并给出相关定理及其证明。  相似文献   

15.
姚晟  徐风  吴照玉  陈菊  汪杰  王维 《控制与决策》2019,34(2):353-361
属性约简是粗糙集理论一项重要的应用,目前已广泛运用于机器学习和数据挖掘等领域,邻域粗糙集是粗糙集理论中处理连续型数据的一种重要方法.针对目前邻域粗糙集模型中属性约简存在的缺陷,构造一种基于邻域粗糙集的邻域粗糙熵模型,并基于此给出邻域粗糙联合熵、邻域粗糙条件熵和邻域粗糙互信息熵等概念.邻域粗糙互信息熵是评估属性集相关性的一种重要的方法,具有非单调性变化的特性,对此,提出一种基于邻域粗糙互信息熵的非单调性属性约简算法.实验分析表明,所提出算法不仅比目前已有的单调性属性约简算法具有更优越的属性约简结果,而且具有更高的约简效率.  相似文献   

16.
汪琼枝  郑文曦  王道然 《计算机科学》2016,43(Z6):81-82, 102
属性约简是Rough集理论的重要研究内容,基于信息熵的属性约简是一种有效的属性约简方法。在实际应用中,获取的信息系统通常是不完备的。针对这种问题,在容差关系下对个体进行分类时,基于属性子集redu与CAttr(属性全集)-redu之间的内在联系,定义了一种新的知识熵,提出了一种新的应用近似模糊熵的不完备信息系统属性约简算法(newS算法),其时间复杂度是O(|C|2∑mi=1(kpi)2)。最后,在ROSE和UCI data中的6个数据集上进行了实验仿真,结果表明newS算法是可行的,并且在同等约简效果下与其他算法相比具有更高的属性约简效率。  相似文献   

17.
龚勋  王国胤 《计算机科学》2006,33(4):151-154
Rough集理论的代数观点和信息论观点在不相客容决策表中的不等价性导致了这两种观点得出的结论不一致。我们研究了使这两种观点等价的条件,定义一种新的决策表信息熵计算方法,在此方法的基础上给出了Routh集理论代数观的一种新的信息观解释,并证明了这种新的信息观与代数观是等价的。新的信息观定义为寻找高效的知识约简算法奠定了基础。  相似文献   

18.
互信息的序决策信息系统属性约简研究   总被引:1,自引:0,他引:1  
优势关系粗糙集理论是粗糙集理论有意义的推广,决策信息系统知识约简是粗糙集理论的核心内容之一.通过在协调序决策信息系统中引入条件熵、互信息概念,给出了基于条件熵、互信息的协调序决策信息系统属性约简算法,并通过学生评价决策信息系统验证了该算法的有效性,使协调序决策信息系统的属性约简得到了扩展.在不协调序决策信息系统中引入限定条件熵、限定互信息概念,并给出基于限定互信息的不协调序决策信息系统属性约简算法,为不协调序决策信息系统的属性约简的应用提供了可行的解决方法.  相似文献   

19.
传统的并行属性约简算法通过利用抽样技术获取小数据样本进行知识约简,但对于大数据集来说,样本数据不具有一般性且无法代表整个数据集.为了弥补传统并行属性约简算法只能用来计算最小属性约简、处理小数据集的缺陷,论文通过分析了先验知识在粒计算中的重要性,结合云计算技术处理海量数据的优势,以粗糙集理论为背景,从不同角度、层次出发建立层次粗糙集模型,提出基于云计算的层次粗糙集模型约简算法,讨论并实现了知识约简算法中的可并行化操作,利用Hadoop在普通计算机集群上进行试验,从运行时间、加速比、可扩展性三个方面对所提出基于正区域、信息熵、边界域算法的重要性进行评价.实验证明:基于云计算的层次粗糙集模型约简算法可以有效处理大数据集.  相似文献   

20.
基于粗糙集的医疗数据挖掘研究与应用   总被引:1,自引:0,他引:1       下载免费PDF全文
医疗数据挖掘能够对现有病历数据库中数据进行自动分析并且提供有价值的医学知识。针对临床病历数据库中存在大量重复样本和冗余属性,从而影响医疗诊断的精度和速度这一问题,建立了基于信息论的粗糙集理论模型和SQL语言之间的关系,提出了基于SQL语言的条件信息熵属性约简算法,利用数据库查询语言实现了数据清洗、求核和属性约简等过程。实验结果表明该算法实现简单,运行效率高,为粗糙集理论更广泛地应用于具体的医疗数据挖掘提供了一种方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号