共查询到20条相似文献,搜索用时 62 毫秒
1.
基于粗糙集理论的属性约简算法 总被引:4,自引:1,他引:4
粗糙集理论是一种新的数据挖掘方法,其主要思想是保持分类能力不变的情况下,通过属性约简,达到发掘知识并简化知识的目的.从大量数据发现知识时,属性约简是一个关键问题.在理解和分析基于粗糙集理论的数据挖掘算法基础上,提出了一个基于属性依赖度的属性约简算法.实验结果表明,该算法能更有效地对决策系统进行约简. 相似文献
2.
3.
属性约简是粗糙集理论的重要研究分支,对信息系统进行属性约简有助于提高其数据的分类性能。针对医疗信息系统的多类型复杂数据环境,首先对多种数据类型分别提出了数据对象之间的模糊相似性度量;然后将这些度量方法进行整合,构造出医疗信息系统的一种新的模糊等价关系,并提出相应的模糊粗糙集模型;最后利用模糊粗糙依赖度,提出了医疗信息系统的一种属性约简算法。实验分析证明了所提出的算法具有更高的属性约简性能。 相似文献
4.
5.
邻域粗糙集是数值型属性数据处理的有效工具.基于邻域粗糙集,传统依赖度及其约简未考虑邻域覆盖的绝对结构,由此文中建立加权依赖度及其启发式约简算法.首先,提出加权依赖度并得到其度量改进性与粒化单调性,定义相关的属性约简.然后,分析邻域半径的自适应取值,构造基于加权依赖度的启发式约简算法(NWDR).最后,在UCI数据集上进行对比实验,验证加权依赖度的单调性与NWDR的有效性.实验证明,加权依赖度改进传统依赖度的不确定性表示能力,NWDR具有较高的分类准确率与较强的应用适应性. 相似文献
6.
属性约简的依赖度算法研究 总被引:6,自引:3,他引:6
属性约简是粗糙集理论中的一个重要内容,其核心任务是得到属性集的核。本着决策属性对条件属性的依赖程度,文章给出了属性约简的依赖度算法,并且给出了证明和实例。 相似文献
7.
传统粗糙集分类方法过于严格,对噪音过分敏感。针对带不确定因子决策系统,提出一种基于属性依赖度的约简算法,使含不确定信息及数据噪音的系统中的属性得以简化,找到一种具有广泛表达能力的数据隐含格式,删去冗余的规则,并保持系统的原有用途和性能。通过一个例子实现了该算法。 相似文献
8.
不完备信息系统下的变精度粗糙集模型及其知识约简算法 总被引:20,自引:2,他引:20
1 引言 Z.Pawlak提出的粗糙集理论,提供了一种新的知识获取手段,但是,应用经典粗糙集理论的一个重要前提是它的处理对象必须是完备信息系统。现实中,由于数据采集能力不足等原因又使得大量的信息系统是不完备的,因此需要对经典粗糙集理论进行必要的扩充。目前有两种扩充方法,一是间接处理方法,即先通过一种方式将不完备信息系统转化为完备信息系统,再使用针对完备信息系统的方法对其进行处理;二 相似文献
9.
10.
一种基于粗糙集的最小约简算法 总被引:4,自引:6,他引:4
随着计算机技术的发展,急剧产生海量的数据。如何从这些数据中提取有用的信息是一个重要的问题。一种新的数据分析方法——粗糙集理论被提出。该理论在分类的意义下定义了模糊性和不确定性的概念,是一种处理不确定和不精确问题的新型数学工具。文中首先对近年兴起的粗糙集的基本概念进行了叙述,在此基础上运用粗糙集理论提出一种新的约简算法。 相似文献
11.
一种基于粗糙集的决策系统属性约简算法 总被引:28,自引:1,他引:28
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。 相似文献
12.
为解决传统遗传算法在属性约简时会出现迭代次数多,收敛较慢的问题,论文提出了一种改进的遗传算法。该方法在适应函数上加入属性重要度因子,同时在交叉操作中有选择地保留子代个体,确保算法能够快速收敛。实验结果证明,改进之后的算法在保证属性约简的基础上,能够实现比传统遗传算法更快的迭代和收敛。 相似文献
13.
14.
一种基于Rough集理论的属性约简启发式算法 总被引:9,自引:1,他引:9
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中属性的最小相对约简,在Rough集理论的基础上构造了一个新的算子,将信息论角度定义的属性的重要性作为启发式信息,来描述在决策表中条件属性所提供的知识对决策属性的影响;并采用宽度优先搜索策略,提出了一种新的属性约简启发式算法.以原始条件属性集为起点并结合算子,通过向属性核的递减式逼近,得到属性的最小相对约简.实例分析表明,该算法能有效地对决策表属性进行约简. 相似文献
15.
基于邻域粗糙模型的高维数据集快速约简算法 总被引:1,自引:0,他引:1
根据粒子群优化算法的思想,给出了求解高维邻域决策表的一个约简算法SPRA。通过采用固有维数的分析方法MLE等,将其估算的维数值作为SPRA算法的初始化参数,提出了高维数据集快速约简算法QSPRA。利用5个UCI标准数据集对该算法进行了验证,结果表明,该算法是有效的、可行的。详细分析了种群规模和迭代次数对结果产生的影响。实验表明,基于核的启发式添加算法思想已经不适合求解高维数据集。 相似文献
16.
17.
粗糙集的核心问题是知识的约简和获取。该文提出一种基于组合变换的粗糙集属性约简算法,此算法基于数理逻辑的组合推理,采用核属性和单属性进行过滤,并用超集关系对候选约简进行消减。分析表明,算法具有较好的时间复杂度和空间复杂度。 相似文献
18.
基于遗传算法的粗糙集属性约简算法 总被引:20,自引:0,他引:20
属性约简是粗糙集理论中的一个核心问题,为了有效获取属性最小相对约简,本文提出了一种基于遗传算法的粗糙集属性约简算法.该算法将核引入遗传算法的初始群体来提高算法的性能,依照决策属性对条件属性的依赖度,在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够获得最佳的搜索效果.实验结果证明了该算法能够快速有效的进行属性约简。 相似文献
19.
目前有很多粗糙集的推广模型通过引入参数的方法处理含有噪音的实际问题。基于粗糙集推广模型的约简算法可以发现保持信息含量不变的最小属性子集,但是其明显的不足是计算不同参数上的约简时,每次都要从头开始执行。将嵌套结构的理论结果应用于k-近邻模糊粗糙集的快速约简算法设计中,并利用嵌套结构,设计了一个基于已有约简的快速约简算法。该算法的特点是在参数改变时,不必重新运行经典的算法,而是利用已有的约简来计算新的约简。数值实验验证了快速约简算法可以显著地节省运行时间,表明了该算法的可行性和有效性。 相似文献
20.
遗传算法适合复杂问题的处理因此可用于属性约简的求解.目前利用遗传算法进行属性约简的主要不足是:适应度函数计算复杂,效率不高.尤其在处理大型决策表时,计算时间将大量聚集在适应度函数的计算上,从而导致算法性能下降.为了更快的计算适应度函数,在研究基于正区域的区分对象对集的基础上,设计了一种计算适应度函数的快速方法.利用启发信息设计了一种快速的属性约简遗传算法.通过实例分析和算法实验表明该算法能够高效求出决策表的属性约简并且适合处理大型决策表. 相似文献