共查询到18条相似文献,搜索用时 62 毫秒
1.
针对现有属性约简算法存在的问题,利用信息论和粗糙集理论,提出一种基于相对可辨识矩阵的决策表属性约简算法.该算法以核属性为基础,通过建立相对可辨识矩阵,利用条件信息熵作为启发式信息,减少属性约简过程中的搜索空间,逐个添加条件信息熵最大的属性,直到找出最小约简为止,并分析了该算法的时间复杂度.实例分析结果表明,该算法能有效地对决策表属性进行约简. 相似文献
2.
3.
属性约简是Rough集理论研究中的一个关键问题,已有的算法大致可以分为增加策略和删除策略2类,都是采用不同的启发式或适应值函数来选择属性。该文提出一种基于属性在可辨识矩阵中出现频率的新算法,以核为基础,不断从可辨识矩阵中选入出现频率最高的属性,直到可辨识矩阵元素集为空。为了得到Pawlak约简,算法增加了反向删除操作。实验分析表明该方法比其他方法快且有效。 相似文献
4.
基于可辨识矩阵的快速粗糙集属性约简算法 总被引:1,自引:0,他引:1
Karno Bozi提出的Core Searching算法在向约简中插入候选属性的时候,根据属性出现次数需要循环查找可辨识矩阵中的所有剩余项,直至矩阵为空,导致计算量较大和结果中冗余属性存在的可能.基于Core Searching算法提出通过给属性设立计数器的基于可辨识矩阵的快速属性约简算法,实例分析表明,该算法与Core Searching算法相比,在计算量减少和循环次数减少的同时能得到更简约的结果,是一种快速、高效的属性约简算法. 相似文献
5.
6.
陈超 《计算技术与自动化》2012,31(1):86-88
为了过滤掉不相关或相关程度较低的属性,就必须使用属性约简算法,从而使得属性约简成为粗糙集中一个核心的研究课题。基于差别矩阵的属性约简算法求解时总是先要求出差别矩阵,当问题规模增大时,将导致存放差别矩阵的空间过大和算法执行时间过长。针对这一问题,本文提出辨识集的定义,并利用辨识集设计一个新的属性约简算法。新算法在属性约简过程中不生成差别矩阵和大量的无用元素,大大减少存储量和计算量,从而提高算法的效率。实验验证了新算法的高效性。 相似文献
7.
基于邻域辨识矩阵的属性约简增量式算法 总被引:3,自引:0,他引:3
邻域粗糙集模型可以直接处理连续型数据.属性约简是邻域粗糙集模型的重要研究内容之一.目前已有的增量式粗糙集约简算法主要考虑经典的粗糙集模型的情况,不适用于邻域粗糙集模型.为此,提出一种基于邻域辨识矩阵的属性约简增量式算法,主要考虑连续型数据对象动态增加的情况下的属性约简问题.为了解决该问题,提出了一种邻域决策系统的辩识矩阵,通过辨识矩阵的动态更新实现动态求核,并在此基础上,利用原有的属性约简进行属性约简的更新. 相似文献
8.
提出了基于分明矩阵的启发式知识约简算法.该算法以分明矩阵中属性出现的频率作为启发信息,通过构造新的决策表,每次选取出现个数最多的属性,直到选取的属性能够保持原决策表的分类能力,此时得到的集合即是一个约简.试验结果表明,该算法在大多数情况下都能够找到最小约简或令人满意的次优解. 相似文献
9.
聂林娣 《数字社区&智能家居》2009,(9)
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从大量数据中获取知识。进行数据挖掘的方法很多,粗糙集方法便是其中的主要方法之一。属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点。通过对粗糙集理论的属性约简算法的深入研究,本文提出了一种改进的属性约简启发式算法。该算法建立在可辨识矩阵计算基础上。改进算法基于Hu的算法与Jelonek算法,在计算可辨识矩阵的基础上,保证最终能够找到决策信息系统的一个约简,同时较Jelonek算法相比,运算时间明显减少。 相似文献
10.
针对二进制分辨矩阵无法处理连续型数据,提出一种基于邻域的改进二进制分辨矩阵及其属性约简方法。实验结果表明,与先数据离散化,后属性约简的方法相比,利用文中方法提取出的特征属性的分类能力更高。 相似文献
11.
基于可分辨矩阵的属性约简算法需要占用大量的存储空间,可分辨矩阵中许多元素项对约简是多余的;并且随着问题规模的增大,该类算法的效率并不理想。针对上述不足,提出一种基于有序差别集的属性约简算法,该算法不需要创建可分辨矩阵和生成多余的元素项,大大降低了存储量和计算量,从而提高了属性约简效率,使算法的时间复杂度和空间复杂度分别降为max{O(|C|2 |U/C|2),O(|C|2|MsCount|)}和O(|MsCount|)。实验表明该算法是有效的、高效的。 相似文献
12.
分析了传统属性频率函数作为属性重要度的不足,重新定义了属性重要度,提出了一种基于差别矩阵属性重要度的属性约简完备算法,即CRABSA(Complete Reduction Algorithm Based on the Significance of Attribute)。该算法采用迭代思想,在每次迭代过程中根据属性重要度SGF(a)选择必要的条件属性加入约简R中。由SGF(a)的定义可知,算法能确保在大多数情况下能得到决策表的最小约简。分析了算法在最坏情况下的时间复杂度,给出了该算法相对Pawlak约简的完备性的证明。 相似文献
13.
一种基于区分矩阵的属性约简算法 总被引:5,自引:3,他引:5
属性约简是粗糙集理论研究的关键问题之一。文章以属性在区分矩阵中出现的频率作为启发,对HORAFA算法做了一些改进。它是以核为基础,加入属性重要性最大的属性,直到不能再加。为了能找到信息系统的最优约简,在此基础上加了一个反向消除过程,直到不能再删为止。最后通过一个实例完整演示了该方法,证实其有效性。 相似文献
14.
在已有的相对属性约简算法中,差别矩阵方法是一种设计属性约简的常用方法。基于系统熵的属性约简是一种新型的属性约简,对于这种属性约简,目前还没有差别矩阵方法去设计其属性约简算法。为此,首先构造了一种新的差别矩阵,同时给出了该差别矩阵的属性约简定义,然后证明了基于新差别矩阵的属性约简与基于系统熵的属性约简是等价的。最后用新差别矩阵设计了一个基于系统熵属性算法,并用实例说明了新算法。 相似文献
15.
属性约简是粗糙集理论的重要研究内容之一,目前已有许多属性约简算法。但这些算法中主要针对一致决策表,当决策表是不相容的情况下,常用的计算全部属性约简的差别矩阵算法会产生错误的结果。为了解决这个问题,引入了一个改进的二进制分辨矩阵,提出了一种基于改进的二进制分辨矩阵的属性约简算法。并利用上述算法结合实例进行属性约简,证明了算法的正确性和有效性。 相似文献
16.
基于决策表的区分矩阵增量属性约简算法 总被引:1,自引:0,他引:1
张长胜 《计算机工程与应用》2012,48(35):110-113,117
对于决策表中存在对象动态变化的现象,当利用静态的属性约简算法处理这类决策表时算法效率并不理想,为了有效提高增量属性约简算法的效率,对决策表进行了简化,并证明了基于简化区分矩阵的属性约简与基于区分矩阵的属性约简是一致的,在利用原的属性约简的基础上,提出了一种基于决策表的区分矩阵增量属性约简算法,通过实例分析说明算法的有效性和可行性。 相似文献
17.
垂直划分二进制可分辨矩阵的属性约简 总被引:1,自引:0,他引:1
针对二进制可分辨矩阵属性约简方法在处理大数据集时的不足,首先给出两种二进制可分辨矩阵属性约简的定义,并证明这两个属性约简定义与正区域的属性约简定义是等价的;然后,给出对二进制可分辨矩阵按条件属性垂直划分后进行属性约简的方法;为了进一步降低空间开销,提出将垂直分解的二进制可分辨矩阵存于外部介质中,在约简过程中,仅将所需部分调入内存,由此设计启发式属性约简算法,其时间和空间复杂度的上界分别为 (∣ ∣∣ ∣2)和 (∣ ∣2);最后,理论分析和实验结果验证了该算法的正确性和高效性. 相似文献
18.
为了解决基于差别矩阵属性约简的计算效率问题,分析了基于差别矩阵的属性约简算法的不足,给出了新的差别矩阵的定义,大大减少了差别矩阵中非空元素的个数,提高了属性约简算法的效率。利用单个属性的不可辨识性来计算出现频率最多的属性,进一步降低差别矩阵的大小,并设计了基于新的差别矩阵的快速属性约简算法。对UCI一些数据库进行了仿真,实验结果表明了新算法具有高效性。 相似文献