共查询到18条相似文献,搜索用时 78 毫秒
1.
属性约简是Rough集理论研究中的一个关键问题,已有的算法大致可以分为增加策略和删除策略2类,都是采用不同的启发式或适应值函数来选择属性。该文提出一种基于属性在可辨识矩阵中出现频率的新算法,以核为基础,不断从可辨识矩阵中选入出现频率最高的属性,直到可辨识矩阵元素集为空。为了得到Pawlak约简,算法增加了反向删除操作。实验分析表明该方法比其他方法快且有效。 相似文献
2.
针对现有属性约简算法存在的问题,利用信息论和粗糙集理论,提出一种基于相对可辨识矩阵的决策表属性约简算法.该算法以核属性为基础,通过建立相对可辨识矩阵,利用条件信息熵作为启发式信息,减少属性约简过程中的搜索空间,逐个添加条件信息熵最大的属性,直到找出最小约简为止,并分析了该算法的时间复杂度.实例分析结果表明,该算法能有效地对决策表属性进行约简. 相似文献
3.
基于可辨识矩阵的快速粗糙集属性约简算法 总被引:1,自引:0,他引:1
Karno Bozi提出的Core Searching算法在向约简中插入候选属性的时候,根据属性出现次数需要循环查找可辨识矩阵中的所有剩余项,直至矩阵为空,导致计算量较大和结果中冗余属性存在的可能.基于Core Searching算法提出通过给属性设立计数器的基于可辨识矩阵的快速属性约简算法,实例分析表明,该算法与Core Searching算法相比,在计算量减少和循环次数减少的同时能得到更简约的结果,是一种快速、高效的属性约简算法. 相似文献
4.
首先,举例说明文献[1]中基于可辨识矩阵和逻辑运算的属性约简算法用于不相容决策表会产生错误的约简结果;随后,在分析错误产生原因的基础上给出一种改进算法,并借助实例验证了它的有效性;最后,通过分析可辨识矩阵的结构,说明了改进算法与文献[2]基于辨识矩阵的属性约简算法得到的约简结果完全相同,但改进算法具有更高的计算效率. 相似文献
5.
6.
运用可辨识矩阵表示信息系统中所有对象的区分信息,为研究属性约简提供了新方向。然而,传统的可辨识矩阵在构造结束后才利用核属性消除冗余元素项,忽略了核属性在矩阵构建过程中的作用。针对这一问题,文中做了以下研究:1)优化可辨识矩阵的构造方式,在计算任意两个对象的区分信息之前,先判断核属性上的取值是否相等,如果不相等,则直接将对应元素项记为Φ,忽略对其他条件属性的判断;2)提出属性加权重要度的概念,综合考虑每个条件属性占可辨识矩阵中非空元素项的比率(称为宏观重要度)与每个属性对区分对象的贡献程度(称为微观重要度),并通过例子说明了该度量方法的合理性;3)针对优化后的矩阵仍然存在大量冗余元素和空集这一缺陷,结合差别信息树的概念提出基于优化可辨识矩阵和属性加权重要度的差别信息树。按照属性加权重要度对优化可辨识矩阵中所有非空元素项进行排序,使得重要度高的属性被更多的节点共享;且在构建过程中将不包含核属性的元素项映射到树中的一条路径上,而包含核属性的元素项则被直接忽略。最后,提出基于优化可辨识矩阵和改进差别信息树的约简算法HSDI-tree。在UCI的5个数据集上分别比较了HSDI-tree算法与CDI-tree,DI-tree和IDI-tree算法的约简结果和节点个数,实验结果表明HSDI-tree算法能有效找到最小属性约简且空间压缩能力更好。 相似文献
7.
属性约简是粗糙集理论在数据处理方面的重要应用,已有的针对连续型数据的属性约简算法主要集中在基于正域的贪心算法,该方法只考虑了一致样本和其他样本的可辨识性,而忽略了边界样本点间可区分性。为了克服基于正域算法的缺点,提出了连续型数据的辨识矩阵属性约简模型,该模型不但考虑了正域样本的一致性,同时考虑了边界样本的可分性。基于该模型,分析了属性约简结构,定义了辨识矩阵来刻画特征子集的分类能力,构造了实值型数据的属性约简启发式算法,并利用UCI标准数据集进行了验证。理论分析和实验结果表明,提出的算法能够有效地处理连续型数据,提高了数据的分类精度。 相似文献
8.
9.
基于标记可辨识矩阵的增量式属性约简算法 总被引:1,自引:0,他引:1
针对现有增量式属性约简算法中存在的约简传承性差以及不完备现象,提出基于标记可辨识矩阵的增量式属性约简算法.本文首先定义了标记函数,对样本之间的可辨识性进行分类,并将之引入一个新的可辨识矩阵,在新增样本时,结合标记信息可以快速识别可辨识矩阵元素集的异动,获得强传承性的约简超集,在此基础上,设计与标记可辨识矩阵匹配的必要矩阵,用以快速判断并删除冗余属性,确保约简的完备性. 理论分析以及实验测试表明,本算法具有约简传承性强,约简集完备等特点,具有较强的实用性. 相似文献
10.
陈超 《计算技术与自动化》2012,31(1):86-88
为了过滤掉不相关或相关程度较低的属性,就必须使用属性约简算法,从而使得属性约简成为粗糙集中一个核心的研究课题。基于差别矩阵的属性约简算法求解时总是先要求出差别矩阵,当问题规模增大时,将导致存放差别矩阵的空间过大和算法执行时间过长。针对这一问题,本文提出辨识集的定义,并利用辨识集设计一个新的属性约简算法。新算法在属性约简过程中不生成差别矩阵和大量的无用元素,大大减少存储量和计算量,从而提高算法的效率。实验验证了新算法的高效性。 相似文献
11.
属性约简是粗糙集理论研究的核心内容之一,足知识获取的关键步骤.针对大规模数据集,基于决策表差别矩阵属性约简不具备可操作性缺点;以及基于差别矩阵属性频度的约简算法没有考虑到差别矩阵元素中属性个数多少的缺陷.基于差别矩阵元素的基数越小,其属性越重要的思想,按照基数由小到大的顺序,利用矩阵中具有相同基数的矩阵元素的簇集中属性出现的频度,确定属性的重要度,提出一种快速搜索属性约简算法,能快速搜索到属性的最优或次优约简.实验结果表明算法是可行、有效的. 相似文献
12.
基于改进分辨矩阵的属性约简方法 总被引:1,自引:0,他引:1
在分辨矩阵的属性约简算法的研究中,需比较决策系统中各对象生成矩阵元素,导致所得分辨矩阵过于庞大,且造成较大的时间开销.为降低利用分辨矩阵求取属性约简算法的复杂度,依据条件等价类将原决策系统分解为一相容对象集与一非相容对象集,给出条件相对于决策的可辨识关系定义与改进的分辨矩阵定义,将条件相对于决策的可辨识关系变化作为属性约简的判定标准,结果证明改进分辨矩阵的属性约简与保持正域不变的属性约简等价.推理证明与仿真实例说明,改进方法的高效性与完备性. 相似文献
13.
针对目前基于差别矩阵的属性约简算法需要耗费大量的时间和空间,粗糙集中求属性核和属性约简更新效率低以及有关属性约简的增量式更新算法目前还比较少等问题,提出了一种基于改进差别矩阵的属性约简增量式更新算法.该算法在更新差别矩阵时,仅须插入某一行及某一列,或删除某一行并修改相应的列,因而可有效地提高核和属性约简的更新效率.然后在分析新增对象x与原决策系统对象的关系的基础上,给出了属性约简增量更新算法.理论与实验分析表明,提出的算法提高了属性约简的更新效率,明显降低了时间和空间复杂度. 相似文献
14.
概率差别矩阵与不完备信息系统属性约简 总被引:1,自引:0,他引:1
差别矩阵的概念是基于粗糙集理论对信息系统进行属性约简的一个重要内容。针对不完备信息系统的属性约简本文提出了一种概率差别矩阵的概念与构造方法,给出了相关的定理。在此基础上提出了一种利用概率差别矩阵对不完备信息系统属性约简的方法,并给出了应用举例。 相似文献
15.
信息系统中的知识约简和知识发现是粗糙集理论的重要研究方向。针对决策系统中的不可区分关系及区分关系,给出相应的协调集判定定理,进而借助区分矩阵及区分函数给出属性约简方法,并借助实例将其与已有的相关研究工作进行了对比分析。 相似文献
16.
改进的基于简化二进制分辨矩阵的属性约简方法 总被引:1,自引:0,他引:1
在基于二进制分辨矩阵的属性约简方法中,删除法即从属性全集中依次删除冗余属性,直至剩余的属性集是一个最小约简.针对传统的基于二进制分辨矩阵的删除法效率较低且得不到最小约简的问题,提出一种改进的二进制分辨矩阵属性约简方法.首先对决策表进行简化,然后给出一种改进的简化二进制分辨矩阵方法;其次通过一个新的属性约简度量方法一次性删除多个属性,并从理论上分析了该方法的可行性;最后通过实验证明了得到的约简结果是最小约简. 相似文献
17.
18.
为得到决策表的一个最优约简或相对最优约简,提出了一种改进的约简算法,先利用差别矩阵约简算法得出约简全集,然后通过定义约简的可信度、相对于核的属性重要度,计算出决策表的约简,并在中央空调系统节能决策表中应用,结果表明了该算法的有效性。 相似文献