共查询到17条相似文献,搜索用时 140 毫秒
1.
约简是粗集理论的重要概念,由定义计算约简是一个典型的NP问题且由于约简的不唯一,在面对大数据集或高维数据集问题时获得的属性集往往并非是最小的属性约简集.文中针对Rough sets理论的属性约简进行了研究.研究了通过可辨识矩阵求得属性约简集,利用Rough sets与灰色理论相结合,提出一种属性约简的启发式算法,拟合结果表明本约简算法合有效. 相似文献
2.
一种粗糙集属性约简算法 总被引:15,自引:5,他引:15
该文针对RoughSet理论的属性约简进行了研究。利用RoughSet和信息论的相关知识,研究了通过可辨识矩阵求得属性约简集,并利用条件熵来计算属性约简集中属性间的相关性,其平均值最小的属性集即为求得的最佳属性约简的结果。实验证明,它可以取得比较理想的效果。最后利用该文的方法给出了对UCI机器学习数据库的例子的约简结果。 相似文献
3.
基于核属性依赖的属性约简算法研究 总被引:1,自引:0,他引:1
数据库中的数据往往含有大量冗余或不必要的属性,严重降低了数据挖掘算法的时间效率和算法质量,因此删除数据的冗余属性和无关属性即属性约简就成了数据预处理过程中的主要任务,而粗糙集理论是处理属性约简的一个非常实用的理论工具.在深入研究粗糙集理论的基础上,结合数据库操作知识给出了基于核属性依赖的属性约简新方法.该算法能过滤掉属性集合中的无关属性和冗余属性,从而得到满意的属性约简,该算法复杂度较小.实验结果证明了该算法有效. 相似文献
4.
以属性在可分辨矩阵中出现的频率作为启发,对HORAFA算法做了一些改进。引入二进制可辨识矩阵,利用二进制可辨识矩阵求出相对核。以相对核为基础,依次加入属性重要度大的属性,直到不能再加。 相似文献
5.
6.
一种属性与值约简简化算法 总被引:8,自引:0,他引:8
Rough Set理论是处理不确定性知识、不完整数据的重要工具,在Rough Set中属性最小约简与规则提取NP—hard的.本文针对现有属性约简与值约简算法的问题,分析了区分矩阵的特性,在此基础上,提出了属性与值约简的简化算法,并用实例作了验证. 相似文献
7.
以属性在可分辨矩阵中出现的频率作为启发,对HORAFA算法做了一些改进。引入二进制可辨识矩阵,利用二进制可辨识矩阵求出相对核。以相对核为基础,依次加入属性重要度大的属性,直到不能再加。 相似文献
8.
基于粗糙集理论的一种属性约简算法 总被引:4,自引:1,他引:4
MIBARK算法在度量属性的重要性时计算量很大,它需要多次计算不同条件属性组合与决策属性之间的互信息。论文的改进算法以属性的频率作为选择属性的启发信息,由过滤差别矩阵得到属性的频率。实验表明,在获得相同属性约简的前提下,该算法与MIBARK算法相比,属性约简的计算量较少,提高了计算速度。 相似文献
9.
10.
针对基于分辨矩阵约简算法中存在冗余元素,从而导致空间存储代价高的问题,提出一种基于加权浓缩树的属性约简算法。该算法可以进一步剔除冗余元素,压缩存储分辨矩阵中的信息,并且在构建树结构的过程当中考虑了属性重要度的影响。实验结果与C-Tree及差别信息树算法进行比较,提出的算法可以获得更优的属性约简结果,有效地降低了空间复杂度。 相似文献
11.
一种基于Rough集理论的属性约简启发式算法 总被引:9,自引:1,他引:9
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中属性的最小相对约简,在Rough集理论的基础上构造了一个新的算子,将信息论角度定义的属性的重要性作为启发式信息,来描述在决策表中条件属性所提供的知识对决策属性的影响;并采用宽度优先搜索策略,提出了一种新的属性约简启发式算法.以原始条件属性集为起点并结合算子,通过向属性核的递减式逼近,得到属性的最小相对约简.实例分析表明,该算法能有效地对决策表属性进行约简. 相似文献
12.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容。为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法。该算法在不增加算法时间复杂度的前提下能够处理不相容决策表。最后,通过实例完整演示了该方法,表明该算法是有效的。 相似文献
13.
粗糙集理论是一种有效的信息处理工具,属性约简是粗糙集理论研究的一个核心内容.为了能够较为有效地获得不相容决策表较优的属性约简,在对文献[7]中属性约简算法分析的基础上,根据不相容决策表约简不改变决策表正域的原则,仅考虑相对差异比较表中与正域相关的实例对,同时结合属性重要性作为特征选取的启发式信息,提出了一种改进的启发式属性约简算法.该算法在不增加算法时间复杂度的前提下能够处理不相容决策表.最后,通过实例完整演示了该方法,表明该算法是有效的. 相似文献
14.
Rough集理论是对大型数据库进行知识发现的主要方法之一。根据属性集核和相对等价类的概念,对数据库属性集中的属性进行约简,提取相应的规则(知识),是用Rough集知识发现的精髓。该文基于Rough集差别矩阵,提出了属性集的布尔函数的构造方法,并应用吸收律、分配律和等幂律对属性集布尔函数化简。论文证明了属性集布尔函数的化简与属性集的差别矩阵约简等价,同时给出了求相对决策属性基本集的算法和IRIS提供的数据仿真实验结果。 相似文献
15.
决策系统的约简是Rough集理论的核心内容之一,本文提出了一种决策表约简的算法。该算法通过构造一个差异表,不需要对决策表中的记录进行逐条考察,在从差异表中选出重要属性同时也抽取该属性的对对象分类起决定作用的属性值,最后得到原决策系统的简化形式。与传统的约简算法相比,具有更低的复杂性。 相似文献
16.
遗传算法适合复杂问题的处理因此可用于属性约简的求解.目前利用遗传算法进行属性约简的主要不足是:适应度函数计算复杂,效率不高.尤其在处理大型决策表时,计算时间将大量聚集在适应度函数的计算上,从而导致算法性能下降.为了更快的计算适应度函数,在研究基于正区域的区分对象对集的基础上,设计了一种计算适应度函数的快速方法.利用启发信息设计了一种快速的属性约简遗传算法.通过实例分析和算法实验表明该算法能够高效求出决策表的属性约简并且适合处理大型决策表. 相似文献
17.
王杨 《计算机与数字工程》2012,40(4):17-18,31
属性约简是知识发现中的关键问题之一。为了有效地获取最小相对约简,该文基于Hu的区分矩阵,即以属性核为起点,通过向属性核不断添加重要程度最大的属性,同时利用属性之间的关联度,使处理数据的范围不断缩小来减少求约简的时间。该算法在计算量减少的同时能得到更简的结果并能得到所有相对约简,实例分析也验证了该算法的有效性。 相似文献