共查询到17条相似文献,搜索用时 234 毫秒
1.
作为粗糙集理论的一个核心内容,属性约简致力于根据给定的约束条件删除数据中的冗余属性。基于贪心策略的启发式算法是求解约简的一种有效手段,这一手段通常使用数据中的全部样本来度量属性的重要度从而进一步得到约简子集。但实际上,不同样本对于属性重要度计算的贡献是不同的,有些样本对重要度贡献不高甚至几乎没有贡献,且当数据中的样本数过大时,利用全部样本进行约简求解会使得时间消耗过大而难以接受。为了解决这一问题,提出了一种基于一致性样本的属性约简策略。具体算法大致由3个步骤组成,首先,将满足一致性原则的样本挑选出来;其次,将这些选中的样本组成新的决策系统;最后,利用启发式框架在新的决策系统中求解约简。实验结果表明:与基于聚类采样的属性约简算法相比,所提方法能够提供更高的分类精度。 相似文献
2.
基于属性重要性的逐步约简算法 总被引:16,自引:3,他引:16
粗糙集理论研究的重要内容之一是知识约简的有效性计算问题,目前求解知识约简的算法主要有两种:一种是利用辨识矩阵构造区分函数,另外一种是基于属性重要性的启发式算法.这两种算法均能求得决策系统的最小或次小约简,但由于计算的复杂度高,所以当数据量增大时这些算法的计算性能是不能令人满意的.本文在对后一种算法充分研究的基础上设计了基于属性重要性的逐步约简算法,利用在决策系统中己获得的正区域逐步缩小数据处理范围,减少求解时间.本文将该算法与基于属性重要性的算法进行了实验比较并对结果进行了分析. 相似文献
3.
4.
属性约简是粗糙集理论的重要研究内容.目前决策粗糙集的属性约简大多基于全局的决策类,并且都是采用单一的约简准则.针对这一问题,在决策粗糙集下提出一种特定类别属性约简算法.针对特定的决策类,给出一种属性约简的定义,在保证决策区域极大化的同时尽可能地降低决策区域划分时的代价;利用集成学习的方法设计出相应的启发式属性约简算法.通过在UCI数据集上与已有的算法进行实验比较,验证了该算法具有更高的属性约简性能. 相似文献
5.
对于混合决策系统的属性约简,现有方法主要存在动态效果不佳、复杂度过高,以及约简精度差等问题,为此,提出一种启发式增量属性约简方法.针对混合决策系统的动态波动,基于粗糙集建立了邻域关系模型,根据邻域相对差异对增量属性进行更新.同时,为进一步增强约简算法的动态适应性,引入条件熵求解相对差异.考虑到单纯利用邻域依赖虽然有利于... 相似文献
6.
为了获得决策系统中更好的相对属性约简,本文提出了一种基于差别矩阵的启发式属性约简算法。该算法以求差别矩阵为基础,不仅考虑了所选择条件属性与决策属性的互信 息,还考虑了其取值的分布情况,从信息论角度定义了一种新的属性重要性度量方法,将其作为启发式信息,最终求得属性约简集。实例表明,算法能够有效地对决策系统进进行约简,获得比较理想的约简结果,同时约简后的决策规则数目较少。 相似文献
7.
提出了一种基于模糊决策属性依赖度的属性相对约简算法。该算法利用粗糙集理论分析的方法,通过在知识表达系统中引入模糊决策属性依赖度的概念,来描述由条件属性所提供的知识对整体决策的依赖程度,并通过模糊决策属性依赖度定义了条件属性对模糊决策属性的相对重要性,以此作为启发式信息,可以方便地求出相对核,再以相对核作为求解最小相对约简的起点。按重要性的不同逐次选择重要属性添加到相对核中,直至其依赖度达到整体条件属性依赖度时为止。 相似文献
8.
9.
信息观下研究邻域决策系统的属性约简是一种新颖的思路. 通过分析论域下某样本邻域中其他样本与该样本决策属性值的异同, 定义不一致邻域矩阵. 在计算属性重要度时, 利用不一致邻域减少在原条件属性基础上增加一个属性后条件熵的计算时间. 分析得到邻域系统下条件熵与正域的关系, 提出一种信息观下基于不一致邻域矩阵的属性约简算法, 并分析该算法与其他算法的内在联系. 实验结果验证了所提出算法的有效性.
相似文献10.
属性约简是粗糙集理论研究的关键问题,针对求取决策系统所有约简的NP问题,基于差别矩阵提出一种决策系统属性约简优化算法.通过改进差别矩阵得到差别集,在获得核与约简候选信息基础上,以属性频度作为启发式信息,快速有效地求取决策系统的所有约简.分析表明了该算法的可行性与有效性. 相似文献
11.
提出了基于分明矩阵的启发式知识约简算法.该算法以分明矩阵中属性出现的频率作为启发信息,通过构造新的决策表,每次选取出现个数最多的属性,直到选取的属性能够保持原决策表的分类能力,此时得到的集合即是一个约简.试验结果表明,该算法在大多数情况下都能够找到最小约简或令人满意的次优解. 相似文献
12.
基于正域的属性约简算法是利用"下近似"思想,仅考虑被正确区分样本数的约简算法。借鉴"上近似"的思想,利用"邻域信息粒"的概念定义了区分对象集,探讨了其基本性质,并提出了基于区分对象集的属性重要度度量及启发式属性约简算法。该约简算法既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。通过实例分析,说明了所提算法的可行性,并且以6个UCI标准数据集为实验对象,与基于正域的属性约简算法进行对比实验。实验结果说明,采用提出的约简算法得到的约简属性集,与基于正域的属性约简算法相比,在进行分类任务时的分类精度能够保持不变或有所提高。 相似文献
13.
14.
在传统的属性约简算法中,将增加的对象和原来的信息系统整合为一个信息系统,并对这个信息系统重新划分新的等价类,为了降低处理增量式数据的复杂度,在信息系统的属性集上定义了信息论意义下的F-属性重要度,给出了一种增量式F-并行属性约简算法。该算法将增加的多行记录组成一个或若干个新的信息系统进行并行计算。与传统的方式相比,该算法能够很好地适应新加入的数据,同时通过利用优秀的启发式信息避免了增量式属性约简时间复杂度过高的问题,时间效率提高。 相似文献
15.
粗糙集理论(RST)中,求解最小属性约简MAR (minimal attribute reduction)是一种NP-难(non-deterministic polynomialhard)组合优化问题.蚁群优化算法ACO(antcolonyoptimization)是进化算法中的一种启发式全局优化算法,粗糙集理论与ACO相结合,是求解属性约简的一种有效、可行的方式.针对蚁群优化算法易于陷入局部最优解、收敛速度慢等问题,首先以一种改进的信息增益率作为启发信息,提出了冗余检测机制,对每个被选属性和每代最优约简集合进行冗余检测,并提出了概率提前计算机制,可避免每只蚂蚁在搜索过程中相同路径上的信息反复计算;针对大数据集的属性约简问题,考虑到蚁群优化算法具有并行能力以及粗糙集中“等价类”计算的可并行性,提出一种将ACO与云计算相结合用于求解大数据集的属性约简算法,在此基础上,进一步提出一种多目标并行求解方案.该方案可以同时计算出其余属性相对于当前属性或约简集合的重要度.实验结果表明,该算法在处理大数据的情况下能够得到最小属性约简,计算属性重要度的时间复杂度由O(n2)降至O(|n|). 相似文献
16.
17.
基于二进制可辨矩阵的属性约简算法的改进 总被引:11,自引:1,他引:11
属性约简是粗糙集理论的核心内容之一,信息系统中知识(属性)并不是同等重要的,甚至其中某些知识是冗余的。属性约简是在保持信息系统中知识量(即分辨能力)不变的条件下,删除其中不相关或不重要的知识,现已证明寻找信息系统的最小属性约简是NP-hard问题。解决这类问题的一般方法是采用启发式算法求出最优或次最优约简。对支天云等所给出的二进制可辨矩阵的化简算法进行了改进,并根据属性的分辨能力的大小,提出了一种基于二进制可辨矩阵的思路清晰、实现简便的属性约简算法。通过算法分析表明,该算法是更加高效的。 相似文献