共查询到18条相似文献,搜索用时 140 毫秒
1.
MIBARK属性约简算法中根据决策表中增加某个属性所引起互信息的变化来度量属性重要性,新算法以属性依赖度作为衡量属性重要性的标准,采用先添后删的方法,在不影响分类质量的前提下将冗余属性删除,通过仿真实验表明该算法达到较好的属性约简效果。 相似文献
2.
3.
针对经典HORAFA启发式约简算法在以属性频率为重要启发信息约简时,往往不能获得最优属性约简集的问题,本文提出了基于属性频率函数循环重计算的改进启发式约简和挖掘算法(BRFA算法)。该算法在已约简属性基础上,进行剩余属性频率函数的循环重计算,直至区分矩阵为空,能大大节省决策表的最小约简时间并能得到所有相对约简。通过实例分析和UCI机器学习数据库实验表明,BRFA算法在属性约简和挖掘方面具有较好的性能。 相似文献
4.
在基于正域的不一致决策表属性约简算法中,计算正域的算法效率是关键,直接影响到属性约简算法的时间复杂度。针对这一问题,新算法改进了区分矩阵的构造过程,提出了一种有效的在二进制区分矩阵上计算负域的方法,将约简的关键转换为对负域的计算,以属性频率为启发式信息指导属性约简过程。该算法也适用于一致决策表的属性约简。最后,通过实例证明了算法的有效性。 相似文献
5.
6.
7.
对Skowron可辨识矩阵方法进行分析,并应用反例说明基于Skowron可辨识矩阵的属性约简算法对不相容决策表的属性约简,可能会导致错误的结果。针对这一问题,提出了一种基于改进可辨识矩阵的属性频率约简算法。该算法以改进的可辨识矩阵为基础,以属性频率作为启发信息,同时在算法中加入消除冗余属性二次约简过程。提供了实例分析,验证了该算法能够有效地对相容与不相容的决策表进行属性约简。 相似文献
8.
基于滤除性质的属性约简加速算法 总被引:2,自引:0,他引:2
给出粗糙集中正区域的一个滤除性质.当信息表为粗糙确定型表时,应用该性质可以过滤掉表中与不确定性成分有关的记录而不影响属性约简的结果,可以有效地减少属性约简算法的计算量,起到加速属性约简算法的作用. 相似文献
9.
基于关联矩阵的属性约简算法 总被引:5,自引:0,他引:5
利用差别矩阵对信息系统特别是对大规模数据的信息系统进行属性约简研究的一个重要方面就是如何提高计算速度。为改进差别矩阵的应用,提高约简效率,文章提出了关联矩阵的概念,同时,依照决策属性对条件属性的依赖程度,利用关联阵中属性频率的信息,提出了一种属性约简算法。实验结果证明了该算法有效、快捷。 相似文献
10.
11.
12.
针对基于正域的属性约简算法在约简过程中存在重复计算属性相对重要度从而导致算法效率低的问题,从属性度量和搜索策略的角度提出基于知识粗糙熵的快速属性约简算法。首先,在决策信息系统中通过引入知识距离提出知识粗糙熵以度量知识的粗糙程度;其次,利用知识粗糙熵作为属性显著度的评价标准来评估单个属性的重要程度;最后,利用属性重要度对所有条件属性进行排序,且通过属性依赖度删除冗余属性,从而实现快速约简。在六个公开数据集上将所提算法与其他三种算法在运行效率和分类精度上进行对比实验。结果表明,该算法的运行效率比其他三种算法分别提高了83.24%、28.77%和59.92%;在三种分类器中,分类精度分别平均提高了0.83%、0.63%和1.37%。因此,所提算法在保证分类性能的同时,能以更快的速度获得约简。 相似文献
13.
14.
一种新的基于连续属性离散化的属性约简方法* 总被引:1,自引:0,他引:1
通过将连续属性离散化和属性约简结合起来,首先对连续型的属性列进行离散化,得到新的决策表;然后再对新的决策表作属性约简,解决了属性约简过程中由于不考虑连续属性而无法求出准确约简属性的问题。最后通过具体案例表明了该方法具有较好的实用性、有效性,可以很好地应用在含有大量连续属性的数据挖掘项目中。 相似文献
15.
一种基于知识粒度的启发式属性约简算法 总被引:1,自引:0,他引:1
属性约简是粗糙集理论进行知识获取的核心问题之一。根据属性相似度与知识粒度的一致性,通过条件属性与决策属性以及条件属性之间的相似度度量,提出了一种基于知识粒度的启发式属性约简算法。根据条件属性与决策属性的相似度对条件属性进行降序排列,根据条件属性之间的相似度度量选择重要的属性,从而得到约简集合。理论分析与实验结果表明,该算法具有较高的运行效率和较好的约简效果。 相似文献
16.
17.
分析了传统属性频率函数作为属性重要度的不足,重新定义了属性重要度,提出了一种基于差别矩阵属性重要度的属性约简完备算法,即CRABSA(Complete Reduction Algorithm Based on the Significance of Attribute)。该算法采用迭代思想,在每次迭代过程中根据属性重要度SGF(a)选择必要的条件属性加入约简R中。由SGF(a)的定义可知,算法能确保在大多数情况下能得到决策表的最小约简。分析了算法在最坏情况下的时间复杂度,给出了该算法相对Pawlak约简的完备性的证明。 相似文献
18.
针对现有邻域粗糙集模型中存在属性权重都相同,无法保证关键属性在属性约简时能够被保留的问题,提出了一种基于信息熵加权的属性约简算法。首先,采用了类间熵、类内熵策略,以最大化类间熵最小化类内熵为原则给属性赋予权重;其次,构造了基于加权邻域关系的加权邻域粗糙集模型;最后,基于依赖关系评估属性子集的重要性,从而实现属性约简。在基于UCI数据集上与其他三种属性约简算法进行对比实验,结果表明,该算法能够有效去除冗余,提高分类精度。 相似文献