共查询到20条相似文献,搜索用时 15 毫秒
1.
属性约简是粗糙集理论的重要研究内容,已有效应用于机器学习、数据挖掘等领域.基于条件信息熵的属性约简可有效推广代数观下的属性约简,但存在抗噪声弱且某些情况下冗余属性多的不足.为此,本文在引入决策表中基于条件信息熵的近似约简概念后,提出决策表中基于条件信息熵的近似约简算法,该算法可有效增强抗噪性,且可依据实际应用的需要有效地对冗余属性进行取舍.最后,本文侧重通过选择不同精度下的约简属性子集在Benchmark上进行了分类器的性能测试. 相似文献
2.
唐鹏飞 《智能计算机与应用》2021,11(10):20-25
集值决策表拓展了经典决策表,但其现有属性约简算法中属性重要度度量方式单一.针对集值决策表,采用近似条件熵提出属性约简及其启发式约简算法.将近似精度与条件信息熵进行信息融合,定义近似条件熵,证明粒化单调性等性质;提出基于近似条件熵的属性约简,设计启发式约简算法;采用集值决策表实例与数据实验进行有效验证.实验结果表明:与现... 相似文献
3.
受Jelonek粗糙集属性约简算法思想的启发,本文利用单属性的近似精度和Hu的差别矩阵方法,得到一个改进的属性约简算法.理论分析表明,该算法比Jelonek算法具有更低阶的计算复杂性. 相似文献
4.
属性约简是粗糙集的一个重要应用.一个数据集往往含有多个属性约简,人们一般用启发式算法找到其中的一个,再通过实验的方法验证其有效性.面对多个属性约简,人们往往难以区别,缺乏有效的手段选取最优或较优的属性约简.使用多种概念漂移的度量指标和信息损失的度量方法比较了同一个知识系统中不同Pawlak约简之间的区别与联系.提出了属性约简重心的概念,并研究其性质.实验结果显示,在众多的属性约简中,离重心最近的属性约简在分类准确率方面具有较大的优势.概念漂移的度量指标和信息损失的度量方法有助于区分不同的属性约简,属性约简的重心有助于在众多的属性约简中选择最优或较优的一个. 相似文献
5.
在粗糙集核属性的基础上,融合小生境免疫优化提出一种决策属性约简方法.将核属性参数作为抗体编码的先验信息,通过疫苗自适应提取算法对抗体群接种疫苗,提高抗体群多样性及稳定性.为降低属性约简的计算复杂度,引入属性集合的分类近似标准作为免疫优化的亲和度,采用小生境免疫共享机制动态调整抗体群的亲和力,提高算法局部搜索能力.通过免疫记忆算子操作促使优良个体的保存,在保证收敛速度的同时具有较强的全局和局部寻优能力.通过滚动轴承故障诊断及UCI数据集的属性约简实验,显示本算法在属性约简精度和效率方面具有较好效果. 相似文献
6.
基于粗糙集信息观的决策表属性约简方法 总被引:2,自引:0,他引:2
粗糙集理论是近年来发展起来的一种有效的处理不精确、不确定、含糊信息的数学理论方法,它被广泛应用于相容和不相容决策表的属性约简和核属性计算。利用反例指出目前基于粗糙集信息观[2、6]的决策表属性约简和核属性计算方法的局限性。对决策表的性质作了深入的研究,研究发现文献[2、6]方法的不足原因是:它们没有考虑U/ind(C)中等价类的相客性。给出了基于U/ind(C)中等价类相客性的属性约简定义和核属性定义,并给出了一种新的基于粗糙集信息观的决策表属性约简和核属性计算方法。讨论了该方法同文献[2、6]方法的区别。最后用相同实例验证了该方法的有效性。 相似文献
7.
8.
9.
基于粗糙集的过程控制规则挖掘算法及应用 总被引:1,自引:0,他引:1
在现代工业生产过程中,如何从实际生产过程中提取出有用的规则,用于调整控制生产是过程控制中一个难题。文章提出了一种基于粗糙集的过程控制规则挖掘算法,可以较大的降低计算复杂度,并将算法用于实际烟草制丝生产线的关联规则提取.得到了可用于实际生产过程控制的规则。 相似文献
10.
11.
粗糙集属性约简的完备算法 总被引:1,自引:0,他引:1
属性约简是Rough Set理论研究中的核心内容之一,现已经证明寻找决策表的最小约简是NP-hard问题.为了快速有效地得到最小约简,本文利用决策表的一些特点提出了一种完备算法,并给出了该算法的复杂度,最后通过实例分析表明,在多数情况下该算法能够得到决策表的最小约简. 相似文献
12.
13.
属性约简是粗糙集的重要研究内容,信息熵是度量信息量的方法.在研究绝对约简和几种相对约简的基础上,归纳出属性约简的一般准则.定义了基于条件属性信息熵的属性约简和基于联合熵的属性约简,研究了几种属性约简与绝对约简之间的关系.定义了基于条件属性信息熵的约简信息损失,澄清了属性约简不损失信息的含糊观念,指出了属性约简只是在约简准则意义下不损失信息,在信息熵意义下可能损失信息.为进一步研究粗糙集、粒计算中属性约简与分类夯实了信息论基础. 相似文献
14.
属性约简的一种新计算方法 总被引:2,自引:0,他引:2
属性核的确定和属性约简是粗糙集理论研究的两个重要问题。目前的计算方法基本上是通过差别矩阵先求出属性核.然后在属性核的基础上再求出属性约简的。而这种方法具有较高的复杂度。因此在定义了相容样本集.证明了相对正域和相容样本集之间的等价性的基础上,提出属性约筒的一种高效方法。 相似文献
15.
基于分明矩阵的序贯属性约简算法 总被引:1,自引:1,他引:0
根据决策表信息系统的分明矩阵及序贯思想,提出了序贯属性约简算法,该算法首先构造递增序列的分明函数,然后利用逐次增加的属性核对分明函数进行分支运算,并建立属性约简树,从而求出所有约简.该算法避免了大量的逻辑运算,实现了高维数据的高效属性约简.理论分析和实验结果表明该算法具有更高的运行效率. 相似文献
16.
针对无核信息系统的特点,基于互信息提出了一种新的启发式属性约简算法,该算法以增加属性后的互信息增量和属性自身的信息熵2项指标作为评价属性重要度的依据。实验结果表明,该算法避免了对于没有核属性的无核信息系统因随机选择初始属性造成计算复杂度增大的问题,并且属性约简效率提高,属性约简后的个数也相对较少。 相似文献
17.
18.
针对经典的粗糙集方法在处理不完备测试数据时,将完备化和属性约简先后进行易导致完备化数据产生偏差而影响属性约简准确性的问题,给出一种基于不完备熵的属性约简算法.通过对属性重要度概念在粗糙熵和不完备熵定义上进行拓展,立足原始测试数据直接计算各条件属性的属性重要度,从而获取一个较优的属性约简.该方法不仅充分考虑了不完备数据与属性约简之间的联系,而且约简结果更加精确,最后在某型装备故障诊断中应用验证了其有效性和优越性. 相似文献
19.
基于粗糙集理论,对基于属性重要度的启发式属性约简算法进行了改进,并将改进后算法运用于纳税人属性约简的实际工作中.该算法解决了原有基于属性重要度的启发式属性约简算法结果中存在冗余属性问题,实现了属性选择较小化,并保持原有数据分类能力不发生大的变化.通过属性约简实验结果和实际工作情况对比,证明该算法具有很好的性能. 相似文献