首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
一个基于决策表的快速属性约简算法   总被引:4,自引:0,他引:4  
在目前已出现的基于Rough Set的属性约简算法中,认为以近似质量为启发信息并非十分理想,以快速缩小搜索空间为目的设计了一个新的较为合理的度量属性重要性的计算公式,并给出了该公式的递归计算方法,计算该公式的算法的复杂度被降低到O(|C-P||U—UP|),然后给出了一个时间复杂度为max(O|C||U|log|U|,O(|C|^2|U|))的快速属性约简算法,最后用一个实例说明了算法的有效性.  相似文献   

2.
一种信息系统的快速属性约简算法   总被引:3,自引:0,他引:3       下载免费PDF全文
在分析目前已有的基于Rough Set的属性约简算法后,认为计算属性的重要性的算法复杂度可以进一步降低,同时给出了一个新的较为合理的度量属性重要性的计算公式,并分析了该计算公式的性质,然后给出了一个时间复杂度为max{O|A‖U|log|U|,O(|A|2|U|)}的快速属性约简算法,最后用一个实例说明了算法的有效性。  相似文献   

3.
一个复杂度为max(O(|C||U|),O(|C|2|U/C|))的快速属性约简算法   总被引:93,自引:3,他引:90  
以基数排序的思想设计了一个新的求U/C的算法,其时间复杂度被降为O(|C||U|).经研究发现,以近似质量作为启发信息并非十分理想,故以快速缩小搜索空间为目的设计了一个新的较为合理的度量属性重要性的计算公式,并给出了该公式的递归计算公式.计算该公式的算法复杂度被降低到O(|C-P||U'-Up'|).用新公式作为启发信息,设计了一个时间复杂度为max(o(O(|C||U|),O(|C^2|U/C|))的快速属性约简算法,并用一个实例说明了算法.实验结果表明新算法不仅具有高效性而且能处理大型决策表.  相似文献   

4.
基于简化的二进制差别矩阵的快速属性约简算法   总被引:8,自引:0,他引:8  
目前,基于二进制差别矩阵的属性约简算法有如下不足:算法的时间和空间复杂度不理想;所得到的属性约简与由基于正区域的属性约简的定义得到的属性约简不一致。本文给出一个简化的二进制差别矩阵和相应的属性约简的定义,证明了该定义与基于正区域的属性约简的定义是一致的。由于在简化的二进制的差别矩阵中,要先求出IND(C),故设计了一个较好的求IND(C)的算法,其复杂度被降低为O(|U‖U|)。在此基础上设计了一个快速属性约简算法,其时间复杂度和空间复杂度分别被降为max{O(|C|^2(|U'pos‖U/C|)),O(|C‖U|)}和max{O|U|},O(|C|(|U'pos‖U/C|))}。  相似文献   

5.
一种改进的基于二进制可分辨矩阵属性约简算法   总被引:1,自引:0,他引:1  
指出支天云的二进制可分辨矩阵约简算法存在的不足,给出简化的决策表定义和基于二进制可分辨矩阵的属性频率函数的定义。在此基础上,以核属性为初始约简集,以属性频率为启发式信息,提出了一种改进的基于二进制可分辨矩阵的属性约简算法,其最终可以获得一个最优约简,并且算法时间复杂度和空间复杂度分别为max{O(|C| |U|),O(|C|^2| |U|^2)}和0(|C| |U|^2)。通过实例验证,表明该算法是有效的。  相似文献   

6.
MIBARK属性约简算法中根据决策表中增加某个属性所引起互信息的变化来度量属性重要性,新算法以属性依赖度作为衡量属性重要性的标准,采用先添后删的方法,在不影响分类质量的前提下将冗余属性删除,通过仿真实验表明该算法达到较好的属性约简效果。  相似文献   

7.
基于相对熵的一种属性约简算法   总被引:6,自引:0,他引:6  
知识约简是粗糙集理论研究的主要内容之一。在信息系统中引入了知识的相对熵的概念,证明了在知识相对约简过程中相对熵的变化趋势是递减的;利用相对熵的概念,定义了属性的相对重要性,提出了一种基于相对熵的新的属性约简启发式算法,该算法的时间复杂度为O(|C|3|U|2),通过例子分析,表明该算法是有效的。  相似文献   

8.
对基于二进制分辨矩阵的属性约简算法进行深入研究,分析对比几种典型的属性约简算法的性能。在此基础上提出一种基于二进制分辨矩阵的启发式算法。该算法以矩阵的行与列两个方向的特征作为度量属性重要性的依据,更有可能获得决策表的一个最优约简。实验结果表明,该算法有效地提高了约简性能和识别率。  相似文献   

9.
阐述邻域粗糙集和邻域信息熵的基本定义及性质,为避免数值属性信息系统属性约简过程中,属性离散化造成特征信息的丢失,提出一种新的基于邻域信息熵度量数值属性约简算法。扩展邻域信息系统核属性集生成约简属性集,邻域信息熵度量不仅关注约简属性集正域变化,而且考察负域样本空间约简属性邻域等价类在决策属性划分的分布,具备更好的邻域关系度量细粒度。实验表明,对比邻域粗糙集近似度量、邻域有效信息率度量、邻域软间隔度量的属性约简方法,该算法能有效进行邻域信息系统属性约简的同时,也保持了约简属性集更好的分类精度。  相似文献   

10.

属性约简是机器学习和知识发现的研究热点, 而属性重要性度量则是构建属性约简算法的关键环节. 针对不完备的混合型信息系统, 在邻域关系下定义了一种新的属性集成重要性度量—–邻域组合测度, 并据此提出一种基于邻域组合测度的属性约简(NCMAR) 算法. 通过多个UCI 数据集上的实验表明, NCMAR算法不仅能够直接处理符号和数值属性共存的混合信息系统, 而且适用于不完备信息系统, 在获得较小约简结果的同时, 能够保证较高的分类精度.

  相似文献   

11.
对于不完备决策表,给出了区分对象对集和基于区分对象对集约简的定义,并证明出基于区分对象对集的属性约简定义等价于基于广义决策的属性约简定义。在此基础上,提出一种基于区分对象对集的新算法。新算法以区分度[K(ci)]和完备度[P(ci)]为启发信息,结合基数排序,使得算法最终时间复杂度为[O(|C||U|2)],相比传统的算法时间复杂度[O(|C|3|U|2)]和[O(|C|2|U|2)],时间复杂度有效降低。通过实例说明了新算法的正确性和有效性。  相似文献   

12.
不完备决策表中基于对象矩阵属性约简算法   总被引:2,自引:2,他引:0  
基于差别矩阵的属性约简是粗糙集属性约简中最常用的方法。对通常给出的以存储条件属性为基础差别矩阵进行比较后,给出一种对象矩阵的定义。对象矩阵从相容类内对象的决策值与条件属性的关系出发,存储的是对象集。给出对象矩阵的属性约简定义,证明了属性约简与基于正区域的属性约简的等价性。给出一个启发式的属性约简算法,其时间复杂度为max(O(|C|2|Upos||U|),O(|C||U|2)),空间复杂度为O(|C||U|2);通过实例说明方法的可行性。  相似文献   

13.
基于相容矩阵的改进属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
原属性约简算法在计算相容关系时,存在大量重复计算,从而导致时间复杂度为O(|C|3|U|2)。针对该问题,基于不完备决策表,提出时间复杂度为O(|U|2)的高效相容矩阵计算算法,在此基础上,设计改进的基于相容矩阵的属性约简算法。通过实例证明,当空间复杂度相同时,改进算法的时间复杂度从原有O(|C|3|U|2)降为O(|C|2|U|2)。  相似文献   

14.
The integration ofinf ormation systems is becoming increasingly important. A common requirement in distributed data-intensive applications, such as data warehousing and data mining, is that the various databases involved be joined in a process called schema integration. The entity-relationship (ER) model or a variant of the ER model is often used as the common data model. To aid the schema conforming, merging and restructuring phases of the integration process, various transformations have been defined to map between various equivalent ER representations. In this paper, we describe a different approach to integrate ER schemas. We focus on the resolution of structural conflicts, that is, when related real-world concepts are modeled using different constructs in different schemas. Unlike previous work, our approach proposes to resolve the structural conflict between an entity type in one schema and an attribute in another schema and show that the other structural conflicts are automatically resolved. This reduces the manual effort required in integration. We give a detailed algorithm to transform an attribute in one schema into an equivalent entity type in another schema without any loss of semantics, that is, our transformation is both information preserving and constraint preserving.  相似文献   

15.
序信息系统属性约简的一种启发式算法   总被引:5,自引:3,他引:2       下载免费PDF全文
在序信息系统中引入了知识的信息量和知识粒度的概念,得到了它们的若干性质和定理。证明了在知识约简过程中,信息量的变化趋势是递减的;利用信息量的概念,定义了属性的重要性,并以属性重要性作为启发信息,提出了一种基于信息量的属性约简启发式算法,该算法的时间复杂度为O(|A|3|U|2);最后通过例子说明,该算法能得到序信息系统的一个约简。  相似文献   

16.
基于可分辨矩阵的属性约简算法需要占用大量的存储空间,可分辨矩阵中许多元素项对约简是多余的;并且随着问题规模的增大,该类算法的效率并不理想。针对上述不足,提出一种基于有序差别集的属性约简算法,该算法不需要创建可分辨矩阵和生成多余的元素项,大大降低了存储量和计算量,从而提高了属性约简效率,使算法的时间复杂度和空间复杂度分别降为max{O(|C|2 |U/C|2),O(|C|2|MsCount|)}和O(|MsCount|)。实验表明该算法是有效的、高效的。  相似文献   

17.
We investigate the relative size of equivalent nonredundant covers of functional dependencies. Let F and G denote two equivalent nonrebundant FD-covers on a set of attributes R. We show that |F| ⩽ |G|(|R| −1). As a consequence, the cardinality of any nonrebundant cover of functional dependencies differs by a factor of at most || − 1 from the cardinality of an equivalent minimum cover. We show that this bound is realizable. Let size(H) denote the number of attribute symbols used to express a cover H. We deduce the following relationship between the sizes of F and G: size(F) ⩽ size(G) × |R|(|R| − 1).  相似文献   

18.
基于冲突域的高效属性约简算法   总被引:5,自引:0,他引:5  
葛浩  李龙澍  杨传健 《计算机学报》2012,35(2):2342-2350
引入冲突域的概念,研究冲突域的性质.以冲突域中冲突对象数目的变化为度量标准,给出核属性和属性重要性的计算方法,并设计了快速求解核属性和属性重要性的算法.在此基础上,给出高效属性约简算法,该算法以核属性为初始约简集,以属性重要性为启发式信息.在最坏情况下,算法的时间复杂度为O(|C|2|U|),空间复杂度为O(|U|);实验结果表明,该算法是正确的、高效的.  相似文献   

19.
基于直觉模糊粗糙集的属性约简   总被引:3,自引:0,他引:3  
针对Jensen下近似定义的局限性,提出一种新的等价类形式的近似算子表示,并将其推广到直觉模糊环境.在此基础上,将相对正域、相对约简、相对核等粗糙集的知识约简概念推广到直觉模糊环境,提出一种直觉模糊信息系统的启发式属性约筒算法.实例计算表明.该方法比Jensen的属性约简方法更为合理有效.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号