首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
在基于邻域粗糙集的属性约简算法中,正域计算是保证其有效性的重要依据,也是影响其时间开销的最主要部分。为了减少算法时间开销,通过对现有算法FHARA的正域计算进行改进,采取保留策略,利用矩阵保留度量计算值的平方,将原本◢n◣维上的计算改进为1维上的计算,从而缩减了每次度量计算的时间,并在此基础上提出了基于矩阵保留策略的邻域粗糙集属性约简算法,最后通过多个UCI数据集验证了该算法。与现有算法相比较,实验结果表明,对大部分数据集而言,该算法能有效且更快速地得到数据集的属性约简。  相似文献   

2.
3.
δ-邻域计算是邻域粗糙集模型中操作最为频繁和复杂的步骤。针对当前邻域算法的研究现状,根据样本空间的分布,提出了块集的概念,证明了每个样本的邻域只存在于其相邻的块集中。在此基础上,提出了基于块集的邻域粗糙集快速约简算法,降低了计算邻域的时间复杂性,并利用多个UCI标准数据集对该算法进行了验证。结果表明,该算法是有效的、可行的。  相似文献   

4.
基于粗糙集的快速属性约简算法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
通过分析现有相容决策表属性约简算法,找出了计算低效性的根源。新的约简算法从论域的角度出发,采用层次结构,用属性边界域作为度量属性重要性启发函数。该算法使得论域不断缩小的同时,又能选出反映决策表系统特征的重要属性。理论分析和实验表明,该算法保证在分类精度不变的前提下,获得最优或次优的约简属性集。  相似文献   

5.
基于正域的属性约简算法是利用"下近似"思想,仅考虑被正确区分样本数的约简算法。借鉴"上近似"的思想,利用"邻域信息粒"的概念定义了区分对象集,探讨了其基本性质,并提出了基于区分对象集的属性重要度度量及启发式属性约简算法。该约简算法既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。通过实例分析,说明了所提算法的可行性,并且以6个UCI标准数据集为实验对象,与基于正域的属性约简算法进行对比实验。实验结果说明,采用提出的约简算法得到的约简属性集,与基于正域的属性约简算法相比,在进行分类任务时的分类精度能够保持不变或有所提高。  相似文献   

6.
邻域粗糙集可以直接处理数值型数据, F- 粗糙集是第一个动态粗糙集模型. 针对动态变化的数值型数据, 结合邻域粗糙集和F- 粗糙集的优势, 提出了F- 邻域粗糙集和F- 邻域并行约简. 首先, 定义了F- 邻域粗糙集上下近似、边界区域; 其次, 在F- 邻域粗糙集中提出了F- 属性依赖度和属性重要度矩阵; 根据F- 属性依赖度和属性重要度矩阵分别提出了属性约简算法, 证明了两种约简方法的约简结果等价; 最后, 比对实验在UCI数据集、真实数据集和MATLAB生成数据集上完成, 实验结果显示, 与相关算法比较, F- 邻域粗糙集可以获得更好的分类准确率. 为粗糙集在大数据方面的应用增加了一种新方法.  相似文献   

7.
作为Pawlak粗糙集的扩展,邻域粗糙集能有效地处理数值型的数据。但是,因为沿用了Pawlak粗糙集在构造上下近似集时的包含关系,邻域粗糙集对噪声数据的容错性很差。针对这个问题,本文通过引入贝叶斯最小风险决策规则,提出了一种基于容错改进的邻域粗糙集属性算法。通过和现有的算法进行比较,实验结果表明,在数据预处理阶段用该算法能得到更好的属性约简。  相似文献   

8.
基于遗传算法的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
为了研究粗糙集理论中属性约简问题,给出了一种属性相对重要度定义,证明了其合理性,并将它应用到基于遗传算法的约简算法中,提出一种启发式遗传算法.算法采用修正策略保证群体进化收敛于最小约简,同时引入属性相对重要度作为启发信息,加快算法的收敛速度.对算法进行的时间复杂度和完备性分析以及数值实验表明,基于遗传算法的粗糙集属性约简算法具有完备、快速收敛等特点.  相似文献   

9.
在分析邻域粗糙集模型弊端的基础上,提出了非对称变邻域粗糙集模型,并以全局属性重要度为启发条件,构造了基于非对称变邻域粗糙集模型的属性约简的启发式算法.利用6个UCI标准数据集与现有算法进行了比较分析,结果表明,该模型不仅可以选择较少的属性个数,而且还能保持较高的分类能力.  相似文献   

10.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

11.
基于邻域粒化和粗糙逼近的数值属性约简   总被引:31,自引:0,他引:31  
对于空间中的任一子集,通过基本邻域信息粒子进行逼近,由此提出了邻域信息系统和邻域决策表模型.分析了该模型的性质,并且基于此模型构造了数值型属性的选择算法.利用UCI标准数据集与现有算法进行了比较分析,实验结果表明,该模型可以选择较少的特征而保持或改善分类能力.  相似文献   

12.
一种粗糙集属性约简算法   总被引:8,自引:3,他引:5       下载免费PDF全文
庄静芸  徐中伟  喻钢 《计算机工程》2009,35(15):67-69,7
基于粗糙集理论提出一种新的属性重要度的度量方法,引入决策强度的概念,克服经典粗糙集理论约简定义的不完备性及无法获得最优属性约简的缺陷,改进基于信息熵的启发式属性约简算法,通过对既有线CTCS-2级车站列控中心软件测试平台的测试数据的实证分析,成功获得最优属性约简,发现数据之间的潜在联系及规律,给出决策规则,使决策分析更为高效。  相似文献   

13.
全粒度粗糙集是一种动静结合的粗糙集模型,在一定程度上可以表示人类认识的复杂性、多样性和不确定性.文中定义概念的全粒度属性约简,完善全粒度粗糙集属性约简的定义.探索概念的全粒度属性约简、全粒度绝对约简及全粒度Pawlak约简的性质,指明这些属性约简之间的关系,有助于全粒度属性约简的实际应用及启发式算法的产生.  相似文献   

14.
全粒度粗糙集时空复杂度较高,难于计算属性约简.针对此问题,文中利用等价类定义信息系统中的可区分度,并研究其性质,证明基于可区分度的属性约简等价于绝对约简.定义决策系统中的正区域可区分度,并探究其性质,证明基于正区域可区分度约简是全粒度Pawlak约简的超集,但绝大部分情况下等于全粒度Pawlak约简,可作为全粒度Pawlak约简的近似.理论分析和实验表明,相比其它属性约简算法,基于正区域可区分度约简在计算复杂度和分类准确率等方面具有较大优势.  相似文献   

15.
基于模糊粗糙集的传统约简算法的时间代价较高,在处理大规模数据时耗时过长,且在许多实际大规模数据集上存在有限时间内无法收敛等问题。因此将权重引入属性约简的定义中,其中属性权重是属性重要度的数值指标。通过构建优化问题来求解属性权重,证明了属性依赖度即是属性权重的最优解。因此,提出了基于属性权重排序的约简算法,从而大大提升了约简的速度,使得约简算法可以应用于大规模数据集,特别是高维数据集中。  相似文献   

16.
粗糙集的划分贴近度及基于划分贴近度的属性约简算法   总被引:1,自引:0,他引:1  
Rough集理论是近年来发展起来的一种处理不确定、不精确、不完整数据的数学工具.属性约简是粗糙集的核心内容之一.本文提出了一个新的不确定性度量一划分贴近度,并基于划分贴近度分别提出了对一般信息系统和决策信息系统进行属性约简的算法,对决策信息系统进行约简的算法不仅可以对一致决策表进行约简,还可以对不一致决策表进行有效的约简.  相似文献   

17.
属性约简是数据挖掘中的一种粗糙集方法,它决定了能代表整个信息系统的重要属性的集合.本文提出了一种求最小约简的基于命题可满足性(简称SAT)的算法,提出一个解决SAT问题的分割和结合的算法.实验结果表明,本文所提算法在高准确分类的基础上,在所得约简中大大减少了规则的数目.  相似文献   

18.
刘芳  李天瑞 《计算机科学》2016,43(12):63-70
介绍了基于概率粗糙集模型的启发式属性约简算法,提出了概率粗糙集模型中的概率近似精度和改进概率近似精度的增量更新机制,通过比较概率近似精度的更新值得到属性核,然后通过比较改进概率近似精度的值逐步得到概率粗糙集中的属性约简。最后提出了一种概率粗糙集模型中属性核与属性约简的加速求解算法,并举例说明了所提算法的有效性和可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号