首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
知识约简是数据挖掘应用中知识获取的重要步骤。经典的知识约简算法是一次性将小数据集装入内存中进行知识约简,而传统的并行知识约简仅仅利用任务并行来提高约简算法效率,都无法处理海量数据。通过分析经典的知识约简算法,构建了不可辨识的对象对,提出了保持边界域划分的知识约简算法,并探讨了保持边界域划分的知识约简算法之间的关系。深入剖析了知识约简算法中数据和任务同时并行的可行性,提出了云计算环境下保持边界域划分的知识约简算法框架模型,在Hadoop平台上构建了云计算环境并进行了相关实验。实验结果表明该知识约简算法可以处理海量数据集。  相似文献   

2.
针对现有三支决策模型的研究对象多为单一性数据的决策系统,对于混合数据边界域样本处理的研究相对较少,本文面向混合数据提出了基于核属性的代价敏感三支决策边界域分类方法。该方法基于正域约简计算混合邻域决策系统的核属性集,在此基础上计算混合邻域类,并利用三支决策规则分别将对象划分到各决策类的正域、边界域和负域;提出了一种基于代价敏感学习的三支决策边界域分类方法,并构造了误分类代价的计算方法,以此划分边界域中的对象。通过对UCI上的10个数据集进行实验对比与分析,进一步验证了本文方法,为处理边界域样本提供了一种可行有效的方法。  相似文献   

3.
黄国顺  文翰 《计算机应用》2015,35(10):2771-2776
为了建立边界域条件信息熵与属性约简之间的关系,证明了边界域和整个论域上的条件信息熵相等,得到信息熵约简的边界域条件信息熵表示。利用严凸函数和Jensen不等式,讨论了边界域条件信息熵的若干性质,给出保持边界域条件信息熵不变的充要条件。为了得到正域约简的边界域条件信息熵表示,给出了保持正域不变的边界域条件信息熵充要条件,从而得到正域约简的边界域条件熵判定方法,它是一致决策表正域约简判定方法的推广形式。最后设计一个数值算例阐述如何应用边界域条件信息熵计算正域约简和信息熵约简。  相似文献   

4.
属性约简是粗糙集理论的核心内容之一。通过对多种约简方法进行比较,为了得到更好的结果,在传统基于属性依赖度的约简方法基础上,定义更精确的强化正域概念。通过对边界域的精确划分,得出各条件属性对决策属性的强化依赖度,并用自顶向下的启发式搜索算法得到约简结果。采用UCI标准数据集对基于强化正域约简方法REPR进行测试,约简数据后构建的决策树规模小,分类精度高。实验结果表明,相比于经典方法,REPR能更有效地对决策表进行属性约简。  相似文献   

5.
基于边界域的不完备信息系统属性约简方法   总被引:1,自引:0,他引:1  
刘芳  李天瑞 《计算机科学》2016,43(3):242-245, 284
研究了用矩阵来计算不完备信息系统的属性约简方法,引入了容差关系矩阵等概念来计算决策表的上下近似集;然后给出了基于容差关系矩阵的决策表边界域的计算方法,再利用边界域的基数相等作为评价属性约简的准则,提出了基于边界域的启发式约简方法;最后,举例说明了属性约简的操作方法和所提算法的可行性。  相似文献   

6.
单调性在经典粗糙集属性约简过程中发挥着重要的作用。然而,在一些泛化模型(如量化粗糙集模型)中该性质并不存在。针对该问题,提出了量化粗糙集模型中下近似单调约简的定义,并给出了求得该约简的启发式方法。实验结果表明,相较于下近似保持约简算法,下近似单调约简算法不仅耗时短,而且增加了由正域和边界域表示的确定性,同时降低了由边界域带来的不确定性。  相似文献   

7.
在基于正域的不一致决策表属性约简算法中,计算正域的算法效率是关键,直接影响到属性约简算法的时间复杂度。针对这一问题,新算法改进了区分矩阵的构造过程,提出了一种有效的在二进制区分矩阵上计算负域的方法,将约简的关键转换为对负域的计算,以属性频率为启发式信息指导属性约简过程。该算法也适用于一致决策表的属性约简。最后,通过实例证明了算法的有效性。  相似文献   

8.
属性约简是粗糙集研究的核心内容之一.已有的大多数属性约简算法都是采用基于正域的贪心算法求决策表的代数约简.事实上,对于不一致决策表,代数约简改变了决策类族原有的Pawlak拓扑结构,造成决策类的不确定性扩大.为此,提出了一种新的基于粗集边界域的约简模型,它能够保持决策类族原有的Pawlak拓扑结构.依据新模型,提出了一种高效率的基于粗集边界域的属性约简算法.理论分析和实验表明,所提算法是有效可行的.  相似文献   

9.
经典粗糙集属性约简基本都是保持正域、负域和边界域不变,而决策粗糙集对属性的增减过程不具备单调性,因此不可能同时保持3个区域均不变。在决策粗糙集模型中,作出决策更应该考虑风险最小化原则,因此提出一种改进的风险最小化属性约简方法,在属性的选取过程中同时考虑所选取的属性子集对决策的划分能力,即联合属性重要度以及风险最小化。实验证明所提方法是有效的。  相似文献   

10.
黎敏  冯圣中  樊建平  刘清 《计算机科学》2012,39(1):223-227,247
属性约简是粗糙集研究的核心内容之一。已有的大多数属性约简算法都是采用基于正域的贪心算法求决策表的代数约简。事实上,对于不一致决策表,代数约简改变了决策类族原有的Pawlak拓扑结构,造成决策类的不确定性扩大。为此,提出了一种新的基于粗集边界域的约简模型,它能够保持决策类族原有的Pawlak拓扑结构。依据新模型,提出了一种高效率的基于粗集边界域的属性约简算法。理论分析和实验表明,所提算法是有效可行的。  相似文献   

11.
冯丹    黄洋  石云鹏  王长忠 《智能系统学报》2017,12(3):371-376
属性约简是粗糙集理论在数据处理方面的重要应用,已有的针对连续型数据的属性约简算法主要集中在基于正域的贪心算法,该方法只考虑了一致样本和其他样本的可辨识性,而忽略了边界样本点间可区分性。为了克服基于正域算法的缺点,提出了连续型数据的辨识矩阵属性约简模型,该模型不但考虑了正域样本的一致性,同时考虑了边界样本的可分性。基于该模型,分析了属性约简结构,定义了辨识矩阵来刻画特征子集的分类能力,构造了实值型数据的属性约简启发式算法,并利用UCI标准数据集进行了验证。理论分析和实验结果表明,提出的算法能够有效地处理连续型数据,提高了数据的分类精度。  相似文献   

12.
现有的很多属性约简算法都是由构造决策表的差别矩阵出发,将矩阵中非空元素的合取范式转化为极小析取范式。为提高对大规模数据的决策表进行约简的效率,文中指出基于U/{a}划分的最小约简算法存在的缺陷,给出以划分粒度为启发式信息,利用单个条件属性把论域划分成多个等价类,将计算整个全域上的属性约简问题转化为计算在相应划分的子区域上属性约简问题,提出了一种基于决策表分解的最小属性约简算法。理论分析和实例表明该约简算法是有效的。  相似文献   

13.
决策表中大量的不相容对象和相同对象会降低粗集约简算法性能,出现错误的属性核和约简结果。因此文中首先讨论决策表的不相容对象与相同对象即冗余对象对约简结果的影响,然后提出利用对象频度概念来删除冗余对象,组建最简决策表的算法。把求最简决策表的算法与高学东的粗集约简算法结合起来,形成了一种具有较好的处理不相容决策表、决策规则较合理的粗集约简算法。实例证明,该算法性能时间与空间复杂度与高学东算法相同,但明显优于Hu Xi-aoHua、叶东毅等的算法。  相似文献   

14.
康猛  蒙祖强 《计算机应用》2022,42(2):449-456
基于区分矩阵的传统属性约简方法具有直观易理解的优点,但时间和空间复杂度都很高,当数据规模较大或条件属性较多时,会无法快速得到约简结果.为解决该问题,在区分关系的基础上构造了条件区分能力来进行属性选择,提出一种基于条件区分能力的属性约简算法.而为了进一步加快属性重要性的计算、提高约简效率,依据大数定律中频率的稳定性,通过...  相似文献   

15.
分布式虚拟环境在划分区域后,区域边界附近的化身不能实时交换动态信息。针对这一情况,提出了区域重叠划分方法,通过增加一定的网络负载和多播组数目,来最大限度地保证相邻化身之间实时交换数据。详细分析了区域重叠划分方法,以及实现中的具体问题。  相似文献   

16.
通过利用粗糙集中差别矩阵的思想,引入不完备决策表的区分对象对集的概念。并给出不完备决策表基于区分对象对集的属性约简定义。同时,也证明了利用该定义得到的不完备决策表的属性约简与基于正区域的属性约简是等价的。相比较基于正区域的不完备决策表属性约简算法,基于区分对象对集的属性约简算法时间复杂度是降低的。最后,用一个实例说明了该算法的合理性。  相似文献   

17.
属性约简是一种特殊的特征选择方法,是粗糙集理论中的核心内容之一。正域约简是一类常见的启发式的约简方法,它通常采用前向贪婪搜索策略产生候选的属性子集,以相对正域作为启发信息和停止条件。根据互补条件熵的随划分的变化规律,分四种情况分析了约简过程中某个属性加入属性子集后,相对正域和互补条件熵的变化,并在此基础上提出了一种以互补熵为启发信息的正域属性约简方法。实验分析表明,新方法与传统的正域约简算法相比,可以得到属性数量更少且决策性能非常接近的约简,同时可以有效地提高约简计算效率。  相似文献   

18.
对于一致决策表,现有基于相对粒度、相对划分粒度、知识量和同可区分度的属性约简与分别代数约简是等价的,但对于不一致决策表,它们与代数约简并不等价.为此,针对不一致决策表,建立相对粒度与新条件信息熵、知识量和同可区分度之间的线性关系,从而得出结论:现有基于相对粒度、相对划分粒度、知识量和同可区分度的属性约简本质上仅与基于差...  相似文献   

19.
一种扩展正域的属性约简方法   总被引:1,自引:0,他引:1       下载免费PDF全文
冯林 《计算机工程》2010,36(21):62-64
在经典粗糙集理论模型中,边界域过大会限制其实际应用。针对这一情况,指出决策表中边界域扩展为正域已有方法存在的不足,基于不确定条件下的自主式学习理论,定义一种新的扩展正域方法,并提出计算不相容决策表中认知属性核和认知属性约简的算法。实验结果证明了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号