首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
黄国顺  曾凡智  文翰 《计算机科学》2014,41(7):236-241,274
给出如何保持正区域不变的语义分析,提出一种修正条件信息熵计算公式,证明保持修正条件信息熵不变与保持正区域不变相互等价。在此基础上,给出代数约简概念的修正条件信息熵表示。给出反例说明修正条件信息熵不具有单调性,导致没法给出自底向上的启发式约简算法,证明了代数协调集中不可删除属性的不可逆性质,提出一种自顶向下直接删除属性的高效约简算法。它从所有条件属性集出发,逐步删除不必要的属性,只需遍历各属性一次,即可保证得到原始决策表的一个代数约简。数值算例和实验验证了该算法的正确性和高效性。  相似文献   

2.
首次将严凸函数引入知识粒度研究中,提出基于严凸函数的知识粒度理论框架。根据该理论框架,给出一系列知识粒度度量函数,证明现有多种常见的知识粒度度量是该理论框架的特殊情形或变种。给出基于严凸函数的相对粒度定义,虽然对任意严凸函数导出的相对粒度不满足单调性,但对一些特殊严凸函数导出的相对粒度证明其单调性,并给出等号成立的条件。证明现有条件信息熵都是文中提出的严凸函数相对粒度的特殊情形,揭示它们的知识粒度本质。针对一致决策表,证明相对粒度与正区域不变等价,从而得到一致决策表代数约简的相对粒度判定方法。数值算例验证文中结论的正确性。  相似文献   

3.
一种基于相对粒度的决策表约简算法   总被引:6,自引:2,他引:4  
在知识粒度的基础上,针对决策表提出了相对粒度和属性相对重要性的概念,证明了知识的相对粒度随着知识粒度的增大而单调增加的变化规律,在此基础上提出了一种基于相对粒度的启发式约简算法,以弥补基于正区域的约简方法处理不一致决策表时存在的不足.通过理论分析和实例验证表明,该算法是有效的,且其时间复杂度相对较低.  相似文献   

4.
从粒度计算的角度对粗糙集理论的属性约简进行研究,分别基于代数方法和信息论方法定义了粒度差和粒度熵的概念,并在此基础上提出了两种新的属性约简算法.实验分析表明,这两种可靠有效的粒度计算方法都能得到信息表的最小约简,为进一步研究知识的粒度计算提供了可行的方法.  相似文献   

5.
决策域分布保持的启发式属性约简方法   总被引:1,自引:0,他引:1  
马希骜  王国胤  于洪 《软件学报》2014,25(8):1761-1780
在决策粗糙集中,由于引入了概率阈值,属性增加或减少时,正域或者非负域有可能变大、变小或者不变,即属性的增减与决策域(正域或非负域)之间不再具有单调性.分析结果表明,现有的基于整个决策域的属性约简定义可能会改变决策域.为使决策域保持不变,引入了正域分布保持约简与非负域分布保持约简的概念.此外,决策域的非单调性使得属性约简算法必须检查一个属性集合的所有子集.为了简化算法设计,提出了正域和非负域分布条件信息量的定义,并证明其满足单调性,从而为设计决策域分布保持约简的启发式计算方法提供了理论基础.为了进一步获得最小约简,提出一种基于遗传算法的决策域分布保持启发式约简算法,并在两种单调的决策域分布条件信息量基础上构造了新算子,即修正算子,确保遗传算法找到的是约简而不是约简的超集.对比实验从分类正确率与误分类代价两个方面都反映了决策域分布保持约简定义的合理性,并且,所提出的遗传算法在大多数情况下都找到了最小约简.  相似文献   

6.
动态属性约简是粗糙集理论的重要研究内容之一.针对动态决策表构造了一种基于信息粒度的动态属性约简模型,详细分析了决策表中出现新属性动态增加时信息粒度的增量式计算方法;在此基础上,以信息粒度作为启发信息,设计了一种动态属性约简求解算法,该算法能有效利用原决策表的属性约简结果和信息粒度来降低算法的计算复杂度,并使得约简结果具有较好传承性;最后通过算例分析和实验比较进一步验证了本算法的可行性和有效性.  相似文献   

7.
决策表属性约简的相对划分粒度表示   总被引:3,自引:0,他引:3  
粗糙集理论认为知识就是分类.本文对知识的分类能力给予了量化,提出利用划分粒度来定量地表示知识的分类能力.在划分粒度概念基础上,针对决策表定义了相对划分粒度并研究了它的性质,相对划分粒度可以定量表示决策表的条件属性子集相对于决策属性的分类能力的强弱;最后证明了对一致决策表的属性约简来说,相对划分粒度表示与Pawlak提出的代数表示是等价的.  相似文献   

8.
为了解决分布式环境中多个参与方在不共享各自隐私数据的情况下完成全局属性约简计算的问题,提出了一种水平划分多决策表下基于相对粒度的隐私保护属性约简算法。该算法基于相对粒度约简理论实现了分布式环境下全局属性约简的求解,利用半可信第三方与安全多方基础协议,设计了安全多方计算相对粒度协议,使各参与方在不共享其隐私信息的前提下达到集中式属性约简的效果。分析结果表明,该算法是有效可行的。  相似文献   

9.
作为度量粒化程度的方式,在粒计算研究领域中,粒度受到了众多学者的广泛关注,其中一种重要且广为接受的模式是参数化粒度.利用这种参数化的粒度表现形式,在面向属性约简的求解问题时,往往需要计算每一个参数所对应的粒度下约简,直至找出所有参数下的约简结果.显然,这种方式会带来巨大的时间消耗.为解决这一问题,提出了一种连续参数意义下的多粒度属性约简策略:首先利用连续参数的区间及粗糙集中不确定性度量的单调性,构造了连续参数下属性约简的约束条件;其次设计了连续参数意义下约简求解的前向贪心搜索算法;最后选取了8组UCI数据集进行实验对比分析,结果表明,相较于多个离散参数下的单粒度属性约简,连续参数意义下的属性约简可以在使得约简中属性的分类性能不发生显著变化的情况下,极大地提升约简求解的时间性能.这一研究为从连续视角进行多粒度建模及相关属性选择工作提供了新的解决方案.  相似文献   

10.
基于粒度计算的特征选择方法   总被引:1,自引:0,他引:1  
从粒度计算的划分模型出发,重新定义了相容决策表的约简,并给出了一种新的基于粒度计算的属性约简算法.该算法以信息熵作为启发信息,通过逐渐增加属性构成条件属性集相对于决策属性的约简,再通过删除约简中的所有不必要属性,得到最小约简.该算法有效地降低了计算属性约简的时间复杂度,可以用于较大规模数据集的特征选择.在5个公开的基因表达数据集上的实验证明了该算法能找到高区分能力的特征子集.  相似文献   

11.

提出一种新的约简算法. 首先以全局等价类为最小计算粒度, 提出粗等价类概念, 深入研究其性质并证明粗等价类下求核和约简与原决策系统等价; 剖析3 类粗等价类与正区域间的内在关联, 设计针对1 和??1 两类粗等价类双边删减下正区域的渐增式等价计算方法, 从而设计双向剪枝策略以及多次Hash 的属性增量划分算法, 基于此给出高效完备的约简算法. 最后用UCI 中20 个决策集、海量、超高维3 类数据集从多个角度进行验证, 结果表明, 所提出的约简算法的完备性和高效性在绝大多数情况下优于现有算法, 尤其适用于海量数据和超高维数据集.

  相似文献   

12.
葛浩  李龙澍  杨传健 《控制与决策》2010,25(12):1891-1895
为了解决因决策表存在不相容性造成求核和属性约简的错误,首先通过增加一个属性列,将原始决策表相容化;然后创建可分辨矩阵,并给出核属性和属性约简的性质,同时证明了由该性质获得的核和属性约简与正区域的核和属性约简是等价的;最后设计属性约简算法及其改进算法,并通过实例验证了该方法的正确性.  相似文献   

13.
属性约简是机器学习等领域中常用的数据预处理方法。在基于粗糙集理论的属性约简算法中,大多是根据单一的方法来度量属性重要度。为了从多角度对属性达到更为优越的评估效果,首先在已有的模糊邻域粗糙集模型中定义属性依赖度度量,然后根据粒计算理论中知识粒度的概念,在模糊邻域粗糙集模型下提出了模糊邻域粒度度量。由于属性依赖度和知识粒度代表了不同视角的属性评估方法,因此将这两种方法结合起来用于信息系统的属性重要度评估,最后给出一种启发式属性约简算法。实验结果表明,所提出的算法具有较好的属性约简性能。  相似文献   

14.
基于Bucket Sort的快速属性约简算法   总被引:2,自引:0,他引:2  
利用桶排序思想设计了一个求解U/C的算法,其时间复杂度降为O(∣C∣∣U∣).由此,给出一种无需求解正域便能判断正域是否变化的方法.基于以上方法,提出一种快速属性约简算法.该算法的求解策略是在每次迭代过程中求解决策表相对核,如果在某次迭代过程中找不到这样的核属性,则任意排除一个条件属性.最后通过实验分析了该算法在最坏情况下的时间复杂性,其复杂性降为O(∣C∣2∣U/C∣).  相似文献   

15.

基于Pawlak 粗糙集的属性约简一般保持决策表的正区域不变, 然而由于现实中不同用户对不同约简精度的需求, 获取属性值的实际代价与个人偏好可能不同. 针对决策者主观个人偏好、客观约简精度、获取属性值的实际代价和决策表各区域的误判代价等综合情况, 提出新的约简算法, 并讨论约简代价与约简精度间的关系. 通过遗传算法, 采用启发式方法搜索出局部最优约简子集. 仿真实验表明, 所提出的算法操作性强, 更适合处理实际决策问题.

  相似文献   

16.
黄国顺  文翰 《控制与决策》2016,31(6):983-989

为了克服现有作积形式不确定性度量方法的缺陷, 基于边界域提出一种用改进粗糙度和知识粒度求和形式的粗糙不确定性度量公式. 与现有方法相比, 它同时考虑了由边界域和知识粗糙性产生的不确定性, 从理论上证明了集成后的不确定性度量值确实比单个影响因素产生的不确定性度量值大, 是一种更加合理的不确定性度量方法. 将该方法推广到基于严凸函数知识粒度情形, 得到一类度量粗糙集不确定性度量方法, 并研究了随划分变细时, 粗糙 度、改进粗糙度与所提出方法之间的关系. 最后设计了一组算例对它们进行比较, 比较结果表明, 所提出的方法对划分变细更加敏感.

  相似文献   

17.

属性约简是机器学习和知识发现的研究热点, 而属性重要性度量则是构建属性约简算法的关键环节. 针对不完备的混合型信息系统, 在邻域关系下定义了一种新的属性集成重要性度量—–邻域组合测度, 并据此提出一种基于邻域组合测度的属性约简(NCMAR) 算法. 通过多个UCI 数据集上的实验表明, NCMAR算法不仅能够直接处理符号和数值属性共存的混合信息系统, 而且适用于不完备信息系统, 在获得较小约简结果的同时, 能够保证较高的分类精度.

  相似文献   

18.
近年来,人们越来越关注粗糙集中的属性约简算法,尤其是启发式的约简算法。为了度量属性重要度,人们把各种不同的信息熵模型应用到粗糙集中,同时在信息熵这一理论的基础上得出了许多约简算法,用来解决粗糙集中属性约简的问题。然而,现有的基于信息熵的方法还存在一系列问题。针对这些问题,本文首先将知识粒度与相对决策熵这2个概念结合在一起,从而引入一种新的信息熵模型--粒度决策熵;然后,利用粒度决策熵来度量属性的重要性,并由此得出新的约简算法--ARGDE约简算法;最后,用不同的UCI数据集来做实验,通过与已有的约简算法比较,该算法能够得到更好的实验结果。  相似文献   

19.

信息观下研究邻域决策系统的属性约简是一种新颖的思路. 通过分析论域下某样本邻域中其他样本与该样本决策属性值的异同, 定义不一致邻域矩阵. 在计算属性重要度时, 利用不一致邻域减少在原条件属性基础上增加一个属性后条件熵的计算时间. 分析得到邻域系统下条件熵与正域的关系, 提出一种信息观下基于不一致邻域矩阵的属性约简算法, 并分析该算法与其他算法的内在联系. 实验结果验证了所提出算法的有效性.

  相似文献   

20.
针对启发式算法难以获得最小约简的问题,研究最小约简约束下属性之间的排斥特性,提出了针对部分最小约简必要条件的属性排斥矩阵.在此基础上,分别结合典型加法类和减法类启发式约简算法提出两种改进的基于属性排斥矩阵的启发式属性约简算法,采用UCI(加州大学欧义分校)机器学习数据集所进行的测试结果表明,属性排斥矩阵能够全面提高启发式属性约简算法的性能,有利于获得最小约简.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号