首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
针对高维数据集的属性约简问题,通过改变经典粒子群算法的运动方程,并用属性依赖性和属性子集特征数构造适应度函数,提出以决策表核属性为基础的最小属性子集搜寻策略。实验结果表明,与其他类型的最小属性约简算法相比,该算法不仅能有效提高获得最小属性约简的机率,同时还大大降低了计算时间。  相似文献   

2.
基于遗传算法的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
为了研究粗糙集理论中属性约简问题,给出了一种属性相对重要度定义,证明了其合理性,并将它应用到基于遗传算法的约简算法中,提出一种启发式遗传算法.算法采用修正策略保证群体进化收敛于最小约简,同时引入属性相对重要度作为启发信息,加快算法的收敛速度.对算法进行的时间复杂度和完备性分析以及数值实验表明,基于遗传算法的粗糙集属性约简算法具有完备、快速收敛等特点.  相似文献   

3.
基于粒度计算的特征选择方法   总被引:1,自引:0,他引:1  
从粒度计算的划分模型出发,重新定义了相容决策表的约简,并给出了一种新的基于粒度计算的属性约简算法.该算法以信息熵作为启发信息,通过逐渐增加属性构成条件属性集相对于决策属性的约简,再通过删除约简中的所有不必要属性,得到最小约简.该算法有效地降低了计算属性约简的时间复杂度,可以用于较大规模数据集的特征选择.在5个公开的基因表达数据集上的实验证明了该算法能找到高区分能力的特征子集.  相似文献   

4.
已有的属性约简算法往往只能提供一个可行解,并且不能保证是最小约简解.因此,详细分析属性约简特征并获得最小约简解具有重要意义.本文针对信息系统数据集提出属性约简矩阵,通过矩阵的结构特征分析得到属性的约简特征,因此采用矩阵代数的方法求解属性约简问题,并得到分层约简快速算法.经实例运算可见,矩阵代数的处理和算法大大降低了最小约简解获取的计算量.  相似文献   

5.
一种基于粗糙集属性频度约简算法的改进   总被引:1,自引:1,他引:0  
为了获得有效的属性最小相对约简,在基于属性频度的启发式约简算法的基础上,提出了一种同时满足属性重要性和频度改进的启发式约简算法.该算法的基本思想是:以属性的核为基础,以频度作为选择属性的启发信息,即把属性频度最大的属性添加到核属性中,这样就把分类能力较强的属性添加到约简集合中,从而能够获得较优的约简.  相似文献   

6.
针对启发式约简算法难以获得最小约简的问题,研究属性之间的排斥与吸引等关联特性,给出属性重要度计算指数。在此基础上,结合属性频率方法,提出基于属性关联的启发式约简算法。该算法以最小约简为目标,采取兼顾单个属性的辨识能力以及属性之间关联的约简策略。实验结果表明,该算法比属性频率方法以及一些同类算法具有更少的属性启发次数,计算结果大部分为最小约简。  相似文献   

7.
阐述了粗糙集理论、遗传约简算法和粒子群约简算法。属性约简是知识发现的关键问题之一。传统的属性约简算法都是串行搜索的,算法效率低且收敛速度慢。将计算智能和粗糙集相结合,提出了一种基于遗传粒子群和粗糙集的最小属性约简算法。该算法利用属性依赖度计算属性核,并在种群初始化时引入属性核作为限制条件,动态调整适应度函数,以达到求得最小属性约简的目的。实验表明,对于数据量大、属性维度高的属性约简问题,该算法具有高效的处理能力。  相似文献   

8.
基于扩展的信息熵的决策表属性约简算法   总被引:1,自引:1,他引:0  
从一种扩展的信息观的角度出发,讨论了Rough集理论的信息论观点。提出了一种基于扩展的信息熵的决策表核属性计算算法.并设计了以属性重要性为启发信息的自下而上的决策表属性约简算法EIEAAR。同时针对不一致表,将属性对不相客对象的包含值作为第二标准选择属性以加快约简速度。EIEAAR算法能处理一致和不一致决策表,并将核属性计算和非核属性约简统一起来。最后,对算法进行复杂度分析并用实例验证算法的有效性。实验表明该算法能有效得到决策表的最小约简。  相似文献   

9.
分布式概念格的属性约简研究   总被引:1,自引:0,他引:1  
概念格的属性约简是形式化概念分析理论的重要研究内容之一,传统的格属性约简方法主要是针对非分布式环境下单个形式背景的,而随着数据分布存储和处理的广泛应用,研究基于分布式环境下概念格的属性约简具有重要的意义.为此,提出属性的超集和确定集的概念,刻画了形式背景中不同类型属性的局部特征与全局特征,推导出属性约简的判定定理;在此基础上,给出计算分布式环境下概念格属性约简的ADSCL和DRCL算法.ADSCL算法用于计算属性的超集和最小确定集,这些约简信息将作为DRCL算法的输入,以计算得到全局形式背景的约简.理论分析和实验结果表明,该算法是有放可行的.  相似文献   

10.
针对经典HORAFA启发式约简算法在以属性频率为重要启发信息约简时,往往不能获得最优属性约简集的问题,本文提出了基于属性频率函数循环重计算的改进启发式约简和挖掘算法(BRFA算法)。该算法在已约简属性基础上,进行剩余属性频率函数的循环重计算,直至区分矩阵为空,能大大节省决策表的最小约简时间并能得到所有相对约简。通过实例分析和UCI机器学习数据库实验表明,BRFA算法在属性约简和挖掘方面具有较好的性能。  相似文献   

11.
针对启发式算法难以获得最小约简的问题,研究最小约简约束下属性之间的排斥特性,提出了针对部分最小约简必要条件的属性排斥矩阵.在此基础上,分别结合典型加法类和减法类启发式约简算法提出两种改进的基于属性排斥矩阵的启发式属性约简算法,采用UCI(加州大学欧义分校)机器学习数据集所进行的测试结果表明,属性排斥矩阵能够全面提高启发式属性约简算法的性能,有利于获得最小约简.  相似文献   

12.
针对属性约简的推广,采用邻域近似条件熵,建立邻域粗糙集的特定类属性约简及其启发算法。粒化分解决策分类的高层邻域近似条件熵,提取定义特定类的中层邻域近似条件熵并得到上下界与粒化非单调性;提出基于邻域近似条件熵的特定类属性约简,设计启发式约简算法;采用决策表实例与数据集实验进行有效验证。所得结果有利于特定类模式识别的不确定性度量与优化应用。  相似文献   

13.
为了获得有效的属性最小相对约简,在基于属性频度的启发式约简算法的基础上,提出了一种同时满足属性重要性和频度改进的启发式约简算法。该算法的基本思想是:以属性的核为基础,以频度作为选择属性的启发信息,即把属性频度最大的属性添加到核属性中,这样就把分类能力较强的属性添加到约简集合中,从而能够获得较优的约简。  相似文献   

14.
邻域粗糙集可以直接处理数值型数据, F- 粗糙集是第一个动态粗糙集模型. 针对动态变化的数值型数据, 结合邻域粗糙集和F- 粗糙集的优势, 提出了F- 邻域粗糙集和F- 邻域并行约简. 首先, 定义了F- 邻域粗糙集上下近似、边界区域; 其次, 在F- 邻域粗糙集中提出了F- 属性依赖度和属性重要度矩阵; 根据F- 属性依赖度和属性重要度矩阵分别提出了属性约简算法, 证明了两种约简方法的约简结果等价; 最后, 比对实验在UCI数据集、真实数据集和MATLAB生成数据集上完成, 实验结果显示, 与相关算法比较, F- 邻域粗糙集可以获得更好的分类准确率. 为粗糙集在大数据方面的应用增加了一种新方法.  相似文献   

15.
首先给出了计算决策表的所有规则的所有约简的一种算法。以此为基础从三个不同的角度(即最小算法包含的约简数最少,或其中每个约简所含合取项最少,或其中所有约简的合取项数之和最少)讨论了最小算法的优化问题,分别证明它们是NP-hard问题,给出了最小算法三种优化问题的启发式算法,并对其时间复杂度进行了分析。最后,演示了三个算例。  相似文献   

16.
属性约简自寻优算法   总被引:25,自引:1,他引:24  
属性约简是知识获取中的关键问题之一。为了能够较为有效地获得较优的属性约简,首先在粗糙集理论的基础上构造出了相对差异比较表,然后把它与启发性知识相结合分别设计出了3个算法:属性约简的改进算法(AR1),属性约简判定的完备算法(RJ)和属性约简的改进增强算法(AR2);接着,将这些算法作为子算法并吸收了基因算法的基本思想和模拟退火算法的具体操作,设计出了属性约简自寻优算法(ADSOA);最后,将该算法应用于中医类风湿关节炎诊断决策表的约简。实验结果表明,属性约简自寻优算法能够以较大的概率和较高的效率获得较优的属性约简,对于某些具体问题来说甚至能够获得最佳的属性约简;这也同时表明相对差异比较表的提出对于进一步构造效率更高的属性约简算法具有较大的实际意义。  相似文献   

17.
属性约简算法CARRDG是近来提出的能计算大型信息系统中所有属性约简的高效算法。针对属性约简算法CARRDG在实现技术层面上的可改进之处,在原有的三种约简分辨图深度优先搜索原则(成员独占原则、友人劝阻原则、陌生人吸纳原则)的基础上,增加新的深度优先搜索原则——阻挡层阻挡原则。由于采用了恰当的数据结构和实现技术,使得增加阻挡层阻挡原则不会增加原算法的程序实现的复杂性,也几乎不会增加程序的运行时间。相反,UCI数据实验结果表明,阻挡层阻挡原则对于某些大型信息系统的约简分辨图的剪枝效率超过了成员独占原则与友人劝阻原则。  相似文献   

18.
差别矩阵约简表示及其快速算法实现   总被引:1,自引:0,他引:1  

差别矩阵可以拥有不同的信息, 根据差别矩阵描述的区分信息量不同, 给出4 种差别矩阵定义, 并提出相应H-约简、S-约简、B-约简和P-约简的概念; 研究4 种约简之间的关系, 构建通用约简算法模型. 为了提高约简算法的效率, 给出相对分辨能力约简定义(RD-约简), 揭示相对分辨能力约简与4 种差别矩阵约简之间的等价性, 进而设计相对分辨能力快速约简算法. 最后, 通过实例和UCI 数据集验证了所提出约简算法的有效性和时空性能.

  相似文献   

19.
基于近似决策熵的属性约简   总被引:3,自引:0,他引:3  
粗糙集理论已被证明是一种有效的属性约简方法. 目前有许多启发式属性约简算法已被提出, 其中基于信息熵的属性约简算法受到了广泛的关注. 为此, 针对现有的基于信息熵的属性约简算法问题, 定义一种新的信息熵模型—–近似决策熵, 并提出一种基于近似决策熵的属性约简(ADEAR) 算法. 通过在多个UCI 数据集上的实验表明, 与现有算法相比, ADEAR算法能够获得较小的约简和较高的分类精度, 具有相对较低的计算开销.  相似文献   

20.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容.为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法.该算法在不增加算法时间复杂度的前提下能够处理不相容决策表.最后,通过实例完整演示了该方法,表明该算法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号