共查询到20条相似文献,搜索用时 85 毫秒
1.
粗糙集理论是一个新的处理不确定性问题的数学工具,属性约简是粗糙集理论的核心问题之一。但求解最优约简已被证明是一个NP—hard问题。基于属性重要度的启发式算法在属性约简中应用的较多.文中分别介绍了基于区分矩阵、基于相关矩阵和基于信息量的属性约简算法。对其思想进行了剖析和总结。 相似文献
2.
针对目前道路交通肇事逃逸案件逐年增多情况,利用改进后的粗糙集属性约简算法对案件记录卷宗中的大量数据进行约简处理,得到和原始数据等效的属性约简集,将此约简集作为挖掘的数据基础,大大缩小了数据量,使得侦破人员可以将注意力集中于重要的物证采集上,减少了案件侦破中不必要的人、财、物消耗,同时数据量的减小也相应的加快了挖掘的速度。将在此约简集基础上挖掘得到的规则和关联规则算法得出的规则进行比较,证明改进后的约简算法是有效的。 相似文献
3.
基于相似关系粗糙集模型的数值属性约简算法 总被引:1,自引:0,他引:1
针对数值属性数据包含大量噪声而经典粗糙集方法易受噪声干扰的问题,提出一种属性度量指标综合衡量属性在样本上的差异性和相似性。以这种属性度量指标为启发式设计了相似关系粗糙集框架下的数值属性约简算法,并推广到经典粗糙集。在车牌字符集和UCI手写体数字字符集上和常用约简算法进行了比较,实验结果显示这种方法产生的约简属性可以导出规则数少并且具有较好分类能力的规则集。 相似文献
4.
5.
6.
作为粗糙集的一种推广,模糊粗糙集在属性约简中的应用尤为重要.约简规模和约简依赖度作为评判约简性能的两个重要指标,分别对应着约简的效率以及精度.传统的约简算法通常以追求约简的最大依赖度为导向进行寻优,并没有直接考虑约简的规模大小.基于此,强调所得约简的规模大小在约简运算中的重要性,并提出一种基于邻域变异信息的多目标差分算法,在约简运算中将约简的规模也作为单独的优化目标,将属性约简问题转化为多目标优化问题,综合考虑约简在属性数量和依赖度两方面的性能.通过引入目标支配排序,使得可以从属性数量和依赖度误差两方面对所得约简的性能进行约束,并得到目标约束内的约简结果.选取UCI上的数据集进行实验分析,实验结果表明,所提算法可以在目标约束内得到更加全面的约简结果,具有一定的可行性,是一种有效的约简算法. 相似文献
7.
粗糙集理论(RST)中,求解最小属性约简MAR (minimal attribute reduction)是一种NP-难(non-deterministic polynomialhard)组合优化问题.蚁群优化算法ACO(antcolonyoptimization)是进化算法中的一种启发式全局优化算法,粗糙集理论与ACO相结合,是求解属性约简的一种有效、可行的方式.针对蚁群优化算法易于陷入局部最优解、收敛速度慢等问题,首先以一种改进的信息增益率作为启发信息,提出了冗余检测机制,对每个被选属性和每代最优约简集合进行冗余检测,并提出了概率提前计算机制,可避免每只蚂蚁在搜索过程中相同路径上的信息反复计算;针对大数据集的属性约简问题,考虑到蚁群优化算法具有并行能力以及粗糙集中“等价类”计算的可并行性,提出一种将ACO与云计算相结合用于求解大数据集的属性约简算法,在此基础上,进一步提出一种多目标并行求解方案.该方案可以同时计算出其余属性相对于当前属性或约简集合的重要度.实验结果表明,该算法在处理大数据的情况下能够得到最小属性约简,计算属性重要度的时间复杂度由O(n2)降至O(|n|). 相似文献
8.
9.
粗糙集理论是模式识别和机器学习的重要内容,属性约简是粗糙集理论中核心步骤。然而传统的粗糙集理论对数据集进行属性约简,计算复杂度高,容易陷入局部最优解。提出了一种新型灰狼优化算法的粗糙集属性约简技术,可以很好地解决传统粗糙集理论出现的弊端。同时为了验证算法的可行性,采用国际通用UCI数据库进行验证,与两种传统的属性约简方法进行对比分析。实验结果表明,该方法属性约简个数少,识别精度高,证明该方法切实可行,操作简单。 相似文献
10.
一种基于粗糙集的决策系统属性约简算法 总被引:28,自引:1,他引:28
从大量数据发现知识时,属性约简是一个关键问题,本文提出了一种新的算法用于粗集中的属性约简,该算法基于Hu的差别矩阵,在对差别矩阵进行化简的基础上,先得到核,然后在逐步减小的差别矩阵中挑选出最频繁的属性加入直到成为一个约简。文中还对求核的正确性,算法的正确性进行了证明,同时对算法复杂度进行了分析,最后给出了一个例子来说明算法的有效性。 相似文献
11.
从粗糙集理论出发,在可分辨关系和对象差异矩阵概念的基础上构造出基于粗糙集理论的并行约简算法。算法首先将原系统划分为多个子系统,然后利用评价指数对划分得到的子系统并行求解,最后以子系统的局部约简结果为基础,求得原系统的约简。算法的时空性能较好,适于处理大规模数据集。 相似文献
12.
属性约简是粗糙集合研究的重要内容之一。为了能够有效地获取决策表中属性最小相对约简,提出了一种基于GA-PSO的属性约简算法。该算法以条件属性对决策属性的支持度为基础,求解核属性,把所有的条件属性(除去核属性)加入粒子群算法的初始种群中,并用遗传算法对不满足适应度条件的粒子进行交叉变异操作。实验结果表明,该算法在加强局部搜索能力的同时保持了该算法全局寻优的特性,能够快速有效地获得最小相对属性集。 相似文献
13.
基于免疫遗传算法的粗糙集属性约简算法 总被引:1,自引:0,他引:1
属性约简是粗糙集理论中一个重要的研究课题,为了有效获取属性最小相对约简,提出了一种基于免疫遗传算法的粗糙集属性约简算法。该算法将免疫算法和遗传算法结合,并将核引入免疫遗传算法的初始抗体群来提高算法的性能,依照决策属性对条件属性的依赖度,并结合抗体浓度,能维持进化过程中个体的多样性,从而提高了算法的全局搜索能力,避免陷入局部最优。实验证明该算法能够快速得到相对最小约简。 相似文献
14.
提出了基于分明矩阵的启发式知识约简算法.该算法以分明矩阵中属性出现的频率作为启发信息,通过构造新的决策表,每次选取出现个数最多的属性,直到选取的属性能够保持原决策表的分类能力,此时得到的集合即是一个约简.试验结果表明,该算法在大多数情况下都能够找到最小约简或令人满意的次优解. 相似文献
15.
李丹 《计算机工程与应用》2017,53(19):168-172
随着网络和通信技术的快速的发展,社会进入了大数据时代。如何能够快速地从海量大数据中找到属性约简是目前研究的一个热点。由于传统属性约简的方法在计算大数据属性约简时,需要消耗巨大的计算时间,不能有效地处理日益积累的大数据属性约简的问题。为了提高传统属性约简算法的效率,针对较大决策信息系统属性约简更新问题,利用多粒度粗糙集理论,提出了基于多粒度粗糙集模型的矩阵属性约简算法,通过2组UCI数据集对所提出的多粒度矩阵属性约简算法的性能进行测试,结果验证了该多粒度矩阵属性约简算法是合理且有效的。 相似文献
16.
属性约简是粗糙集理论中的重要问题。许多学者针对邻域粗糙集提出多种属性约简方法,包括应用最为广泛的启发式算法。在多半径邻域粗糙集的基础上,针对当前启发式约简算法往往会包含一定冗余属性的缺陷,提出一种融合属性权重影响的改进约简运算方法,通过根据各属性权值大小设置阈值使得约简结果能够消除冗余属性。实验选取UCI的数据集与当前几种常用启发式约简算法进行比较分析。实验结果表明,所提出的属性约简方法能够得到更优的约简集合,同时更大程度地保留了决策表本身的知识信息,具有较高的分类能力。 相似文献
17.
18.
随着高维数据的扩散,特征选择成为学习过程中不可或缺的一项任务。属性约简是特征选择的重要方法,为了寻找有效的属性约简方法,将粗糙集与蚁群算法相结合,提出了利用蚁群优化算法的粗糙集属性约简方法。首先从信息素的更新开始,限制其信息素值的上、下限范围,然后根据寻址方式改进候选解的构造方案。实验表明,该方法具有一定的优越性。 相似文献
19.
基于正域的属性约简算法是利用"下近似"思想,仅考虑被正确区分样本数的约简算法。借鉴"上近似"的思想,利用"邻域信息粒"的概念定义了区分对象集,探讨了其基本性质,并提出了基于区分对象集的属性重要度度量及启发式属性约简算法。该约简算法既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。通过实例分析,说明了所提算法的可行性,并且以6个UCI标准数据集为实验对象,与基于正域的属性约简算法进行对比实验。实验结果说明,采用提出的约简算法得到的约简属性集,与基于正域的属性约简算法相比,在进行分类任务时的分类精度能够保持不变或有所提高。 相似文献
20.
传统粗糙集分类方法过于严格,对噪音过分敏感。针对带不确定因子决策系统,提出一种基于属性依赖度的约简算法,使含不确定信息及数据噪音的系统中的属性得以简化,找到一种具有广泛表达能力的数据隐含格式,删去冗余的规则,并保持系统的原有用途和性能。通过一个例子实现了该算法。 相似文献