共查询到19条相似文献,搜索用时 56 毫秒
1.
一种基于Rough集理论的属性约简启发式算法 总被引:9,自引:1,他引:9
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中属性的最小相对约简,在Rough集理论的基础上构造了一个新的算子,将信息论角度定义的属性的重要性作为启发式信息,来描述在决策表中条件属性所提供的知识对决策属性的影响;并采用宽度优先搜索策略,提出了一种新的属性约简启发式算法.以原始条件属性集为起点并结合算子,通过向属性核的递减式逼近,得到属性的最小相对约简.实例分析表明,该算法能有效地对决策表属性进行约简. 相似文献
2.
现实世界中数据集都是动态变化的,非增量式属性约简方法从头重新计算原始数据集,而且未考虑先前约简结果中的信息,将耗费大量的时间和空间。为此,讨论了动态数据环境下约简的不变性,提出了一种面向成组对象集的增量式属性约简算法,利用先前约简中信息来快速获取强传承性的约简,从而提高增量式学习算法效率。最后,将该算法与非增量式约简方法和面向单个对象的增量式约简方法在UCI数据集和人工数据集上进行了相关比较。实验结果表明,面向成组对象的增量式属性约简算法能够快速处理动态数据,具有较好的约简传承性。 相似文献
3.
属性约简是粗糙集理论研究中的重要内容之一,现已证明寻找信息系统的最小约简是NP-hard问题。本文参考普通的增量式数据挖掘算法,提出一种改进的增量式属性约简算法,该算法在执行效率上比其他属性约简算法有了很大的提高,最后通过实例分析验证了算法的可行性和有效性。 相似文献
4.
一种基于粗集理论的增量式属性约简算法 总被引:3,自引:1,他引:2
增量式学习中,当信息系统的对象和决策属性不变而不断增加条件属性时,为了获得该系统的约简属性,一般方法是对决策表中的所有数据重新计算,但这种方法显然效率很低且不必要.在粗集理论的基础上,给出相对区分矩阵和绝对区分矩阵的定义,提出一种新的增量式属性约简算法.通过实例得知:由该算法得到的属性约简与传统算法得到的属性约简结果相同,但该算法不仅降低了时间复杂度而且其分类质量一般要优于原来的分类质量,所以该属性约简具有一定的实用价值. 相似文献
5.
决策表属性约简集的增量式更新算法 总被引:2,自引:0,他引:2
针对动态变化的决策表,研究了属性约简集的动态更新问题。在详细分析新增对象的所有可能情况的基础上,提出一种基于分辨矩阵元素集的属性约简集增量式更新算法。该算法根据新增对象的不同情况快速更新分辨矩阵元素集,依据分辨矩阵元素集中增加和减少的元素有效地更新原属性约简集,快速得到新的最小属性约简。最后,通过5个UCI的数据集验证了算法的有效性。 相似文献
6.
实际应用中,信息系统的数据常常是动态变化的,当对象增加时,原始的属性约简集不一定有效。针对不完备决策系统对象增加的情况,提出基于条件熵的增量式属性约简算法。首先定义不完备决策系统中的条件熵,然后分析对象增加时条件熵的变化机制以及对约简集的影响,提出增量式属性约简算法,当对象增加时,该算法能够更高效地进行属性约简。最后,实验验证本文算法的有效性和高效性。 相似文献
7.
在基于Rough集理论的知识发现过程中,减小属性约简复杂度问题是重要研究内容之一。该文分析了基于遗传算法的约简算法,提出了一种在优化初始群体基础上提高算法性能的遗传约简算法。 相似文献
8.
9.
基于Rough集和数据库技术的属性约简算法 总被引:6,自引:0,他引:6
对核属性的作用,以及求取属性核心的代价等进行了分析,并运用Rough集的理论给出了判定一个属性子集中是否包含属性核心的充要条件.根据这些研究结论对基于粗糙集的属性约简算法进行改进,并利用数据库查询语言实现了算法.实验表明对于大数据集,该算法的效率大大高于一些基于主存的算法,且易于实现. 相似文献
10.
基于邻域辨识矩阵的属性约简增量式算法 总被引:3,自引:0,他引:3
邻域粗糙集模型可以直接处理连续型数据.属性约简是邻域粗糙集模型的重要研究内容之一.目前已有的增量式粗糙集约简算法主要考虑经典的粗糙集模型的情况,不适用于邻域粗糙集模型.为此,提出一种基于邻域辨识矩阵的属性约简增量式算法,主要考虑连续型数据对象动态增加的情况下的属性约简问题.为了解决该问题,提出了一种邻域决策系统的辩识矩阵,通过辨识矩阵的动态更新实现动态求核,并在此基础上,利用原有的属性约简进行属性约简的更新. 相似文献
11.
一种新的属性约简算法 总被引:2,自引:0,他引:2
粗集是一种处理模糊和不确定性数据的工具,属性约简和核是粗集理论的核心内容,经过约简后的数据更有价值,更能准确地获取知识。很多属性约简算法以核为起点,计算繁杂。文中提出并分析了后删除属性约简算法,该算法不需要计算核,节约时间,减少占用空间,简化求解过程。文中以实例验证了算法的正确性。 相似文献
12.
13.
为解决传统遗传算法在属性约简时会出现迭代次数多,收敛较慢的问题,论文提出了一种改进的遗传算法。该方法在适应函数上加入属性重要度因子,同时在交叉操作中有选择地保留子代个体,确保算法能够快速收敛。实验结果证明,改进之后的算法在保证属性约简的基础上,能够实现比传统遗传算法更快的迭代和收敛。 相似文献
14.
为了求取决策表系统中属性的最小约简,本文提出了一种基于免疫算法的属性约简方法。该算法应用决策表的相对核来初始化种群,根据决策属性对条件属性的依赖度和抗体中条件属性的个数设计抗体的适应度函数,通过免疫记忆特性和抗体浓度的促进与抑制作用,保持了个体的多样性,提高了算法的全局搜索能力,避免陷入局部最优现象,从而求解出最小属性约简集合。实验结果表明,算法快速、有效,能得到较好的最小属性约简。 相似文献
15.
遗传算法适合复杂问题的处理因此可用于属性约简的求解.目前利用遗传算法进行属性约简的主要不足是:适应度函数计算复杂,效率不高.尤其在处理大型决策表时,计算时间将大量聚集在适应度函数的计算上,从而导致算法性能下降.为了更快的计算适应度函数,在研究基于正区域的区分对象对集的基础上,设计了一种计算适应度函数的快速方法.利用启发信息设计了一种快速的属性约简遗传算法.通过实例分析和算法实验表明该算法能够高效求出决策表的属性约简并且适合处理大型决策表. 相似文献
16.
提出一种基于粗糙集属性重要性的属性约简算法。该算法以所有条件属性为初始约简集合,以属性重要性为迭代准则,通过逐步缩减来求取约简。同时给出了该算法的时间复杂度分析,并举例验证了所提出算法的有效性和实用性。 相似文献
17.
18.
核属性蚁群算法的规则获取 总被引:1,自引:0,他引:1
蚁群算法是一种新型的模拟进化算法,研究已经表明该算法具有许多优良的性质,并且在优化计算中已得到了很多应用.粗糙集理论作为一种智能数据分析和数据挖掘的新的数学工具,其主要优点在于它不需要任何关于被处理数据的先验或额外知识.本文从规则获取和优化两方面研究基于粗糙集理论和蚁群算法的分类规则挖掘方法.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识理论,将粗糙集理论与蚁群算法融合,采用粗糙集理论进行属性约简,利用蚁群算法获取最优分类规则,优势互补.实验结果比较表明,算法获取的分类规则,具有良好的预测能力和更为简洁的表示形式. 相似文献
19.
粗糙集的核心问题是知识的约简和获取。该文提出一种基于组合变换的粗糙集属性约简算法,此算法基于数理逻辑的组合推理,采用核属性和单属性进行过滤,并用超集关系对候选约简进行消减。分析表明,算法具有较好的时间复杂度和空间复杂度。 相似文献