首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 640 毫秒
1.
针对数据维度过高、冗余信息过多导致维度灾难的问题,提出一种基于异同矩阵的高维属性约简算法(ARSDM)。该算法在区分矩阵的基础上加入对同类样本的相似度衡量,形成对所有样本的综合评估。首先,计算样本在每个属性下的距离,并基于这些距离得到同类相似度和异类差异度;其次,建立异同矩阵,形成对整个数据集的评价;最后,进行属性约简,即将异同矩阵的每一列求和,依次选择值最大的特征进行约简,并将相应样本对的行向量置为零向量。实验结果表明,与经典属性约简算法DMG(Discernibility Matrix based on Graph theory)、FFRS(Fitting Fuzzy Rough Sets)以及GBNRS(Granular Ball Neighborhood Rough Sets)相比,在分类回归树(CART)分类器下,ARSDM的平均分类准确率分别提高了1.07、6.48、8.92个百分点;在支持向量机(SVM)分类器下,ARSDM的平均分类准确率分别提高了1.96、11.96、12.39个百分点;运行效率上ARSDM优于GBNRS和FFRS。可见,ARSDM能够有效去除冗余信息...  相似文献   

2.
杨成福  舒兰 《微机发展》2006,16(9):68-69
给出容差关系下不完备决策系统中属性相对约简的定义,提出一种基于决策属性相对条件属性正域的求取属性约简算法。该算法以相对正域为迭代准则,以所有条件属性为初始约简集合,通过逐步缩减来求取约简,保证了所求取的约简对问题的分类能力不会减弱。同时给出该算法的时间复杂度分析,并举例验证了该算法的有效性和实用性。  相似文献   

3.
基于容差关系的不完备决策系统属性约简算法   总被引:3,自引:0,他引:3  
给出容差关系下不完备决策系统中属性相对约简的定义,提出一种基于决策属性相对条件属性正域的求取属性约简算法。该算法以相对正域为迭代准则,以所有条件属性为初始约简集合,通过逐步缩减来求取约简,保证了所求取的约简对问题的分类能力不会减弱。同时给出该算法的时间复杂度分析,并举例验证了该算法的有效性和实用性。  相似文献   

4.
杨成福  舒兰 《微机发展》2006,16(11):62-63
提出一种基于粗糙集属性重要性的属性约简算法。该算法以所有条件属性为初始约简集合,以属性重要性为迭代准则,通过逐步缩减来求取约简。同时给出了该算法的时间复杂度分析,并举例验证了所提出算法的有效性和实用性。  相似文献   

5.
针对经典HORAFA启发式约简算法在以属性频率为重要启发信息约简时,往往不能获得最优属性约简集的问题,本文提出了基于属性频率函数循环重计算的改进启发式约简和挖掘算法(BRFA算法)。该算法在已约简属性基础上,进行剩余属性频率函数的循环重计算,直至区分矩阵为空,能大大节省决策表的最小约简时间并能得到所有相对约简。通过实例分析和UCI机器学习数据库实验表明,BRFA算法在属性约简和挖掘方面具有较好的性能。  相似文献   

6.
提出一种基于粗糙集属性重要性的属性约简算法。该算法以所有条件属性为初始约简集合,以属性重要性为迭代准则,通过逐步缩减来求取约简。同时给出了该算法的时间复杂度分析,并举例验证了所提出算法的有效性和实用性。  相似文献   

7.
属性约简是粗糙集理论研究的关键问题,针对求取决策系统所有约简的NP问题,基于差别矩阵提出一种决策系统属性约简优化算法.通过改进差别矩阵得到差别集,在获得核与约简候选信息基础上,以属性频度作为启发式信息,快速有效地求取决策系统的所有约简.分析表明了该算法的可行性与有效性.  相似文献   

8.
提出一种基于粗糙集的近似质量求取属性约简的算法。该算法以集合近似的质量为迭代准则,以所有条件属性为初始约简集合,通过逐步缩减来求取约简,保证了所求取的约简对问题的分类量力不会减弱。同时给出了该算法的时间复杂度分析,并举例验证了所提出算法的有效性和实用性。  相似文献   

9.
属性约简是粗糙集理论研究的主要内容之一,正区域计算是多数属性约简算法的关键。为了减少正区域的计算时间,提出基于链表存储的正区域计算方法。将属性值相同的数据存储在链表同一结点对象中,收集过程中不断删除基数为1的子划分,通过降低样本数据的规模来减少计算耗时,加速属性约简。同时,给出不可区分对象对数定义,并以此度量属性重要性,设计一种高效的启发式属性约简方法。通过实例和实验与经典约简算法进行性能测试比较,结果证实该算法在时间和空间效果上切实有效、可行。  相似文献   

10.
陈俞  赵素云  李雪峰  陈红  李翠平 《软件学报》2017,28(11):2825-2835
传统的属性约简由于其时间复杂度和空间复杂度过高,几乎无法应用到大规模的数据集中.将随机抽样引入传统的模糊粗糙集中,使得属性约简的效率大幅度提升.首先,在统计下近似的基础上提出一种统计属性约简的定义.这里的约简不是原有意义上的约简,而是保持基于统计下近似定义的统计辨识度不变的属性子集.然后,采用抽样的方法计算统计辨识度的样本估计值,基于此估计值可以对统计属性重要性进行排序,从而可以设计一种快速的适用于大规模数据的序约简算法.由于随机抽样集以及统计近似概念的引入,该算法从时间和空间上均降低了约简的计算复杂度,同时又保持了数据集中信息含量几乎不变.最后,数值实验将基于随机抽样的序约简算法和两种传统的属性约简算法从以下3个方面进行了对比:计算属性约简时间消耗、计算属性约简空间消耗、约简效果.对比实验验证了基于随机抽样的序约简算法在时间与空间上的优势.  相似文献   

11.
为了获得决策表中更好的属性约简,提出一种信息增益引导的蜂群优化算法;该算法以属性的信息熵为基础构造条件属性与决策属性间的互信息,用待选条件属性引起的信息增益作为引导蜜蜂搜索的启发信息,最终求得属性约简集;对UCI数据库多个数据集的测试结果表明,与其它基于群智能的属性约简算法相比,该算法获得最小属性约简的机率提高到90%以上,同时较对比算法的计算时间少耗费至少10%。  相似文献   

12.
王慧  张骏温 《计算机科学》2012,39(2):209-211,243
基于不完备决策表的属性约简定义有多种,现研究基于知识粒度的属性约简。研究发现,差别矩阵是一种较好的设计属性约简算法的方法。为此,定义了一种粒度差别矩阵和基于该差别矩阵的属性约简,并证明了该差别矩阵的属性约简定义与基于知识粒度的属性约简定义等价。在此基础上,设计了一个新的基于信息量的不完备决策表的属性约简算法,其时间复杂度得以降低。  相似文献   

13.
基于扩展的信息熵的决策表属性约简算法   总被引:1,自引:1,他引:0  
从一种扩展的信息观的角度出发,讨论了Rough集理论的信息论观点。提出了一种基于扩展的信息熵的决策表核属性计算算法.并设计了以属性重要性为启发信息的自下而上的决策表属性约简算法EIEAAR。同时针对不一致表,将属性对不相客对象的包含值作为第二标准选择属性以加快约简速度。EIEAAR算法能处理一致和不一致决策表,并将核属性计算和非核属性约简统一起来。最后,对算法进行复杂度分析并用实例验证算法的有效性。实验表明该算法能有效得到决策表的最小约简。  相似文献   

14.
通过分析目前信息观下不完备信息系统属性约简,针对已提出的几种信息熵存在随着属性的增加系统分类能力减弱的不足,从条件属性确定的容差类在决策属性划分上的分布出发,给出不完备决策表的条件分布信息量的定义;同时,定义了新的属性重要度,并以此为启发信息设计属性约简算法。通过实验说明了该算法对不完备决策表属性约简是可行的。  相似文献   

15.
Attribute reduction based on rough set theory has attracted much attention recently. In real‐life applications, many decision tables may vary dynamically with time, e.g., the variation of attributes, objects, and attribute values. The reduction of decision tables may change on the alteration of attribute values. The paper focuses on dynamic maintenance of attribute reduction when varying data values of multiple objects. Incremental mechanisms for knowledge granularity are proposed first, which aims to update attribute reduction effectively. Then, a group incremental reduction algorithm with varying data values is developed. When attribute values of multiple objects have been replaced by new ones in decision table, the proposed incremental algorithm can find the new reduct in a much shorter time. The time complexity analysis and experiments on different data sets from UCI have validated that the proposed incremental algorithms are efficient and effective to update the reduction with the variation of attribute values.  相似文献   

16.
为了在动态变化的决策表中,快速方便地获得新的属性约简,利用数组元素对差别矩阵中的属性组合进行计数,提出一种基于数组的增量式属性约简更新算法。当决策表动态变化时,根据数组元素的取值变化,获得差别矩阵中增加和减少的元素,依据这些元素更新原属性约简,快速得到新的最小属性约简。理论分析及实例验证了提出的算法是有效的。  相似文献   

17.
基于系统熵的属性约简的简化差别矩阵方法*   总被引:2,自引:0,他引:2  
基于系统熵的属性约简是一种新型的属性约简。该模型由于同时考虑了条件属性集和决策属性集对决策表的分类能力,它是一种考虑较周全的属性约简模型。为设计高效的属性约简算法,首先引入简化差别矩阵, 同时给出了基于该简化差别矩阵的属性约简定义,并证明该定义与基于系统熵的属性约简定义等价;然后用简化差别矩阵设计了一个基于系统熵的完备属性约简算法;最后用实例说明了新算法。  相似文献   

18.
粗糙集的属性约简是一个NP难问题,获得较为高效的算法是研究的主要目的。针对传统的粗糙集属性约简算法效率不高、速度不快的问题,提出基于相关系数和条件信息熵的属性约简算法,把决策表的非核属性约简过程转化为相关系数的运算,能减少对决策表的扫描次数,降低算法时间复杂度,降低算法冗余,提高属性约简的效率。并利用k-fold轮换对比方法计算相关系数,较大地减少了计算量,同时能得到次优属性约简结果。给出了算法内容,并结合实验进行了验证。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号