首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
近来一些学者用差别矩阵或差别矩阵的思想设计了基于正区域的属性约简算法.由于计算差别矩阵是一个既消耗时间又消耗空间的过程,故这些算法的效率并不好.为了降低这类属性约简算法的复杂度,文中利用基于区分对象对的属性约简的思想,在简化决策表的基础上,定义了一个函数,该函数能度量简化决策表中条件属性集产生的区分对象对的个数,并用该函数设计了一个启发函数,同时给出了计算该启发函数的快速算法,经分析其时间和空间复杂度均为O(|U/C|).最后用该启发函数设计了一个有效的基于正区域的属性约简算法,该算法的时间复杂度降为O(|C||U|),空间复杂度降为O(|U|).文中还用一个具体实例说明了新算法的有效性.经实验证明,新算法具有较高的效率.  相似文献   

2.
基于模糊粗糙集的传统约简算法的时间代价较高,在处理大规模数据时耗时过长,且在许多实际大规模数据集上存在有限时间内无法收敛等问题。因此将权重引入属性约简的定义中,其中属性权重是属性重要度的数值指标。通过构建优化问题来求解属性权重,证明了属性依赖度即是属性权重的最优解。因此,提出了基于属性权重排序的约简算法,从而大大提升了约简的速度,使得约简算法可以应用于大规模数据集,特别是高维数据集中。  相似文献   

3.
给出完备决策表和不完备决策表的定义并说明相容关系.给出了相容矩阵及其属性约简的定义,同时也给出差别矩阵及其属性约简的定义,证明了基于相容矩阵的属性约简与关于差别矩阵的属性约简定义是等价的,给出了一个计算条件属性的频率的公式,该公式不必计算差别矩阵,而是直接从决策表中计算出各条件属性在差别矩阵中出现的频率.设计一个快速计算条件属性频率的快速算法,在此基础上,设计了一个高效求基于相容矩阵的属性约简算法,并通过实例对该算法进行了验证.实践证明:算法的复杂度都得以降低,该算法的时间复杂度为O(|C|2|U|),空间复杂度为O(|U|).该方法为计算其他的属性约简算法提供了一条新思路.  相似文献   

4.
基于粒度计算的特征选择方法   总被引:1,自引:0,他引:1  
从粒度计算的划分模型出发,重新定义了相容决策表的约简,并给出了一种新的基于粒度计算的属性约简算法.该算法以信息熵作为启发信息,通过逐渐增加属性构成条件属性集相对于决策属性的约简,再通过删除约简中的所有不必要属性,得到最小约简.该算法有效地降低了计算属性约简的时间复杂度,可以用于较大规模数据集的特征选择.在5个公开的基因表达数据集上的实验证明了该算法能找到高区分能力的特征子集.  相似文献   

5.
一种高效的增量式属性约简算法   总被引:2,自引:0,他引:2  
针对粗糙集中求属性核和属性约简存在的问题,首先给出了改进的差别矩阵定义,进而提出一种基于改进差别矩阵的核增量式更新算法,用于解决对象动态增加情况下核的更新问题;同时,为了降低现有增量式属性约简算法的时间、空间复杂度,提出一种不存储差别矩阵的高效属性约简算法,用于处理对象动态增加情况下属性约简的更新问题.理论分析及实验结果均表明了所提出算法的有效性和可行性.  相似文献   

6.
针对经典粗糙集中属性约简的不足,进一步拓展粗糙集属性约简的应用。提出了一种粗糙集属性近似约简的概念和一种新的粗糙集属性重要性的定义并给出和证明了属性近似约简的性质,理论证明了近似属性约简是传统属性约简的一种推广。在保持知识库分类能力基本不变的条件下,利用所给属性重要性作为启发信息给出了粗糙集属性近似约简的算法。通过一个具体的例子,说明了近似属性约简在信息系统中处理模糊和不确定性知识的可行性和有效性。  相似文献   

7.
属性序下的快速约简算法   总被引:12,自引:0,他引:12  
胡峰  王国胤 《计算机学报》2007,30(8):1429-1435
将分治法的思想溶入Rough集算法中,在给定属性序下,提出了基于分治策略的属性约简算法.利用该算法可以计算给定属性序下的唯一约简,并能快速得到海量数据的属性约简.在一次性将决策表的所有数据调入计算机内存的情况下,算法的平均时间复杂度为O(|U|×|C|×(|C| log|U|)),空间复杂度为O(|U| |C|).仿真实验结果说明了算法的高效性.  相似文献   

8.
基于近似决策熵的属性约简   总被引:3,自引:0,他引:3  
粗糙集理论已被证明是一种有效的属性约简方法. 目前有许多启发式属性约简算法已被提出, 其中基于信息熵的属性约简算法受到了广泛的关注. 为此, 针对现有的基于信息熵的属性约简算法问题, 定义一种新的信息熵模型—–近似决策熵, 并提出一种基于近似决策熵的属性约简(ADEAR) 算法. 通过在多个UCI 数据集上的实验表明, 与现有算法相比, ADEAR算法能够获得较小的约简和较高的分类精度, 具有相对较低的计算开销.  相似文献   

9.
全粒度粗糙集时空复杂度较高,难于计算属性约简.针对此问题,文中利用等价类定义信息系统中的可区分度,并研究其性质,证明基于可区分度的属性约简等价于绝对约简.定义决策系统中的正区域可区分度,并探究其性质,证明基于正区域可区分度约简是全粒度Pawlak约简的超集,但绝大部分情况下等于全粒度Pawlak约简,可作为全粒度Pawlak约简的近似.理论分析和实验表明,相比其它属性约简算法,基于正区域可区分度约简在计算复杂度和分类准确率等方面具有较大优势.  相似文献   

10.
一种快速计算HU差别矩阵的属性约简算法   总被引:7,自引:0,他引:7  
在已有的基于HU差别矩阵的属性约简算法中,一般是以差别矩阵中的元素作为启发信息而设计的,其时间复杂度为O(|C|2|U|2).为降低该属性约简算法的时间复杂度, 首先引入简化决策表的定义,并设计了一个求简化决策表的算法,其时间复杂度为O(|C||U|).然后在简化决策表的基础上,定义了差别区域,并给出基于差别区域的属性约简定义,同时证明了基于差别区域的属性约简与基于差别矩阵的属性约简等价.在此基础上,以快速缩小简化决策表的搜索空间为目的,定义了一个新的、较为合理的、度量属性重要性的公式,并给出了它的递归计算方法,其时间复杂度为O(U/C|).最后以属性重要性为启发信息,设计了一个基于差别矩阵的快速属性约简算法,其时间复杂度降为max(O(|C||U|,O(|C|2|U/C|)),并用一个实例说明了新算法的高效性.理论分析与实验表明,新算法具有较好的扩展性.  相似文献   

11.
基于粗糙集和信息增益的属性约简改进方法   总被引:2,自引:0,他引:2  
针对属性过多对于有效的数据挖掘很不利以及约简中差别矩阵的产生会占用较大存储空间的问题,提出了一种基于粗糙集和信息增益的属性约简改进算法.该算法首先采用信息增益技术对决策表属性进行相关分析,删除部分冗余属性,减小属性约简的复杂度,然后直接从决策表中提取出分明函数,求出属性约简.由于避免了分明矩阵的生成,因此该算法不仅节约了时间和空间,而且提高了效率.  相似文献   

12.
一种否定高信度规则的属性查找算法   总被引:1,自引:0,他引:1       下载免费PDF全文
李莉  邹海 《计算机工程》2008,34(6):65-66
粗糙集理论中可辨识矩阵是在整个论域U上构造的。该文扩展了可辨识矩阵的应用,提出一种否定高信度决策规则的属性查找算法,求出条件属性和决策属性的不可分辨二元关系在等价类上进行运算。在论域U的子集上构造可辨识矩阵,根据分辨函数求解问题。将算法应用于医学数据。实验结果表明,该算法局部采用可辨识矩阵可以有效地减少存储空间,提高查找效率。  相似文献   

13.
一种基于区分度的信息系统属性约简算法   总被引:1,自引:0,他引:1  
在完备信息系统中,通过引入区分度的概念,以相对区分度为启发式信息,提出一种基于区分度的属性约简启发式算法,并对该算法的时间复杂性进行了分析,最后通过例子说明,该算法能得到完备信息系统的一个约简.  相似文献   

14.
一种改进的基于二进制可分辨矩阵属性约简算法   总被引:1,自引:0,他引:1  
指出支天云的二进制可分辨矩阵约简算法存在的不足,给出简化的决策表定义和基于二进制可分辨矩阵的属性频率函数的定义。在此基础上,以核属性为初始约简集,以属性频率为启发式信息,提出了一种改进的基于二进制可分辨矩阵的属性约简算法,其最终可以获得一个最优约简,并且算法时间复杂度和空间复杂度分别为max{O(|C| |U|),O(|C|^2| |U|^2)}和0(|C| |U|^2)。通过实例验证,表明该算法是有效的。  相似文献   

15.
王莎莎  刘辉  方国华  马驰 《计算机应用》2007,27(5):1201-1203
通过研究粗糙集理论中基于可辨识矩阵的属性约简算法,提出了一种适用于案例故障特征优化的属性启发式约简算法。该算法综合考虑了决定故障特征重要性的三个要素,并以通信装备故障案例特征优化为例,验证了该算法的有效性。  相似文献   

16.
基于区分矩阵的数据离散化算法   总被引:1,自引:0,他引:1  
由于传统的粗糙理论只能对数据库中离散数据进行处理,而绝大多数现实的数据库既包含了离散数据,又包含了连续数据。针对这一问题,提出了一种基于候选断点区分矩阵的数据离散化算法。该方法以断点核为起点,以候选断点在区分矩阵中出现的频率作为启发信息,逐次选择最重要的断点加入到结果断点子集中,并由最终的断点集得离散化后的信息系统。最后通过实例分析表明,该算法具有较好的离散化效果。  相似文献   

17.
基于改进的二进制分辨矩阵属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
属性约简是粗糙集理论的重要研究内容之一,目前已有许多属性约简算法。但这些算法中主要针对一致决策表,当决策表是不相容的情况下,常用的计算全部属性约简的差别矩阵算法会产生错误的结果。为了解决这个问题,引入了一个改进的二进制分辨矩阵,提出了一种基于改进的二进制分辨矩阵的属性约简算法。并利用上述算法结合实例进行属性约简,证明了算法的正确性和有效性。  相似文献   

18.
粗糙集理论是机器学习和数据挖掘领域的重要课题之一,其中属性约简算法是该理论实现应用的主要算法。提出了一种基于长度约束区分矩阵的约简算法(RABDMLC算法),通过抽样数据集计算平均区分矩阵项长,构造区分矩阵时不构造长于平均区分矩阵项长的项,在一定程度上提高了约简的效率。与基于属性频度函数的约简算法进行对比试验分析后,验证了该算法是有效和可行的。  相似文献   

19.
基于优势区分矩阵的求核方法   总被引:2,自引:0,他引:2       下载免费PDF全文
在提出基于优势关系粗糙集方法下的类区分矩阵概念后,为解决不一致数据问题,新的优势区分矩阵定义及其求核方法被提出,但是该方法计算代价高。为了能够快速求出存在不一致数据的信息系统的核,该文给出改进的优势区分矩阵定义和求核算法,其空间和时间复杂度都优于现有的算法。实验证明,该算法适用于处理大数据集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号