首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 531 毫秒
1.
唐玉凯    张楠    童向荣    张小峰 《智能系统学报》2019,14(6):1199-1208
属性约简是粗糙集理论研究中最重要的领域之一。经典的不完备决策系统广义决策约简关注决策系统中的所有决策类,而在实际应用中,决策者往往只关注一个或者几个特定决策类。针对以上问题,提出基于多特定类的不完备决策系统广义决策约简理论框架。首先,定义了单特定类的不完备决策系统广义决策约简的相关概念,提出并证明相关定理,构造相应差别矩阵和区分函数。其次,将单特定类的广义决策约简推广到多特定类,提出基于差别矩阵的多特定类的不完备决策系统广义决策约简算法。最后,采用6组UCI数据集进行实验。实验结果表明,相对全部决策类数量,当选定特定类数量较少时,平均约简长度有不同程度的缩短,占用空间有所减小,约简效率有不同程度的提升。  相似文献   

2.
现有的不完备决策系统的分布约简研究主要针对决策系统中的所有决策类,而某些实际应用中,人们往往仅关注于某个特定类的属性约简问题。基于这种考虑,首先提出了基于特定类的不完备决策系统的分布约简的理论框架,给出了在相容关系下的基于差别矩阵的约简算法,最后将该算法与基于所有决策类的不完备决策系统分布约简算法进行对比。实验结果表明,当决策类为特定类时,约简结果的平均长度相对较短,约简效率也有显著的提高。  相似文献   

3.
在粗糙集理论中,属性约简是重要的研究内容之一。通过属性约简可以去除冗余属性,求得保持决策系统某种分类能力不变的最小属性子集。分布约简保持决策系统中所有决策类的分布不变,但针对所有决策类的分布约简在实际问题中可能是不必要的。针对以上问题,文中给出了区间值决策系统中基于α-相容关系的特定类分布约简的概念,证明了特定类分布约简的相关定理,构造了特定类分布约简对应的差别矩阵,提出了基于差别矩阵的特定类的分布约简算法(CDRDM),并分析了特定类的分布约简算法和全局分布约简算法(DRDM)构造的差别矩阵中非空元素的集合之间的关系。实验中选取了6组UCI数据集,引入了区间参数,当区间参数为1.2、阈值为0.5时,比较了DRDM算法和3种不同决策类下的CDRDM算法的约简结果和平均约简长度,并且当区间参数分别为1.2和1.6、阈值分别为0.4和0.5时,给出了DRDM算法和两种不同决策类下的CDRDM算法的约简时间随着对象数目和属性数目的变化情况。实验结果表明,特定类分布约简算法针对不同决策类的约简结果可能不同,并且当决策系统中的决策类数量大于1时,特定类分布约简算法的平均约简长度小于或等于全局分布约简算法的平均约简长度,特定类分布约简算法针对不同的决策类在约简效率上有不同程度的改进。  相似文献   

4.
多特定类的属性约简是粗糙集理论研究的重要分支。通常用户在决策时只关注部分决策类,而现有算法是关注全部决策类,针对部分决策类的约简效率不高。为此,本文提出多特定类的快速约简模型。该模型充分利用正域、边界域和负域的特点,提出了关于多特定类的属性约简算法。实验结果表明,本文提出的算法效率较高,约简长度相对较短。  相似文献   

5.
当前区间类型数据的规模越来越大,若采用传统的属性约简方法进行处理,就需要对数据进行预处理,而这会损失原始信息。针对上述问题,提出了区间值决策系统β分布的约简算法。首先,给出区间值决策系统β分布的概念和约简目标,并证明了提出的相关定理;然后,对于该约简目标构建了β分布约简的差别矩阵和差别函数,提出了区间值决策系统β分布约简算法;最后,使用14组UCI数据集进行实验验证。在数据集Statlog上,当相似度阈值为0.6,对象数目为100、200、400、600、846时,β分布约简算法的平均约简长度为1.6、2.2、1.4、2.4、2.6,基于差别矩阵的分布约简算法(DRADM)的平均约简长度为2.0、3.0、3.0、4.0、4.0,基于差别矩阵的最大分布约简算法(MDRADM)的平均约简长度为2.0、3.0、3.0、4.0、3.0。实验结果验证了所提β分布约简算法的有效性。  相似文献   

6.
区间值决策系统的局部属性约简   总被引:1,自引:0,他引:1  
区间值决策系统中已有的属性约简工作主要针对决策属性中所有的决策类。针对区间值决策系统中决策属性的某些特定类,引入了区间值决策系统局部约简的概念,提出了部分决策类约简的判定定理;利用差别矩阵方法研究局部约简的结构,并给出了基于差别矩阵的局部约简算法。通过局部约简的概念对区间值决策系统的全局约简结构进行进一步刻画,讨论了不协调区间值决策系统的局部约简和全局约简之间的关系。最后通过相关实验验证了所提算法的可行性和有效性。  相似文献   

7.
基于容差关系的不完备决策系统属性约简算法   总被引:3,自引:0,他引:3  
给出容差关系下不完备决策系统中属性相对约简的定义,提出一种基于决策属性相对条件属性正域的求取属性约简算法。该算法以相对正域为迭代准则,以所有条件属性为初始约简集合,通过逐步缩减来求取约简,保证了所求取的约简对问题的分类能力不会减弱。同时给出该算法的时间复杂度分析,并举例验证了该算法的有效性和实用性。  相似文献   

8.
针对决策粗糙集模型,分析了它的正域随条件属性删除时的变化特点,即当条件属性集变小时,决策粗糙集的正域不但会变大,而且可能保持不变或变小。讨论了现有几种与正域相关的决策粗糙集属性约简定义的优缺点,在此基础上提出一种新的保正域不变的决策粗糙集属性约简。计算实例发现,现有基于差别矩阵的决策粗糙集属性约简方法不能求到它的所有保正域约简。上述研究结果说明,决策粗糙集模型与经典粗糙集模型的属性约简问题完全不同,因此不能简单地将经典粗糙集的方法平行推广到决策粗糙集模型上。该文的结论为将来系统研究决策粗糙集模型中的属性约简问题提供了很好的小结和理论基础。  相似文献   

9.
在分辨矩阵的属性约简算法的研究中,需比较决策系统中各对象生成矩阵元素,导致所得分辨矩阵过于庞大,且造成较大的时间开销.为降低利用分辨矩阵求取属性约简算法的复杂度,依据条件等价类将原决策系统分解为一相容对象集与一非相容对象集,给出条件相对于决策的可辨识关系定义与改进的分辨矩阵定义,将条件相对于决策的可辨识关系变化作为属性约简的判定标准,结果证明改进分辨矩阵的属性约简与保持正域不变的属性约简等价.推理证明与仿真实例说明,改进方法的高效性与完备性.  相似文献   

10.
杨成福  舒兰 《微机发展》2006,16(9):68-69
给出容差关系下不完备决策系统中属性相对约简的定义,提出一种基于决策属性相对条件属性正域的求取属性约简算法。该算法以相对正域为迭代准则,以所有条件属性为初始约简集合,通过逐步缩减来求取约简,保证了所求取的约简对问题的分类能力不会减弱。同时给出该算法的时间复杂度分析,并举例验证了该算法的有效性和实用性。  相似文献   

11.
康猛  蒙祖强 《计算机应用》2022,42(2):449-456
基于区分矩阵的传统属性约简方法具有直观易理解的优点,但时间和空间复杂度都很高,当数据规模较大或条件属性较多时,会无法快速得到约简结果.为解决该问题,在区分关系的基础上构造了条件区分能力来进行属性选择,提出一种基于条件区分能力的属性约简算法.而为了进一步加快属性重要性的计算、提高约简效率,依据大数定律中频率的稳定性,通过...  相似文献   

12.
传统启发式正域属性约简算法在每次迭代的过程中需要添加当前正域依赖度最大的属性进入已选定的特征属性子集,算法迭代次数多且效率低,难以应用于高维大规模数据集的特征选择中。针对上述问题,研究决策系统中正域之间的单调关系,给出了多尺度属性粒(MSAG)的形式化描述,提出了一种基于多尺度属性粒的快速正域约简算法(MAG-QPR)。由于多尺度属性粒包含多个属性,可以对已选定的特征属性子集提供较大的正域,因此,通过每次迭代添加MSAG,可以达到减少迭代次数和使选定的特征属性子集能更快地趋近于条件属性全集的正域分辨能力的目的,从而提高了启发式正域约简算法的效率。在实验部分,选取8组UCI数据进行实验,对于数据集Lung Cancer、Flag和German,MAG-QPR与基于正向近似的正域保持属性约简算法(FSPA-PR)、基于正向近似的条件熵属性约简算法(FSPA-SCE)、后向贪婪正域保持属性约简算法(BGRAP)和后向贪婪启发式广义决策保持属性约简算法(BGRAG)的运行时间加速比分别为9.64、15.70、5.03、2.50;3.93、7.55、1.69、4.57;3.61、6.49、1.30、9.51。实验结果表明,所提算法MAG-QPR提高了算法效率,具有更好的分类精度。  相似文献   

13.
差别矩阵方法作为求解粗糙集知识约简的关键技术之一,而差别矩阵中的元素个数将直接影响知识约简算法的计算效率,针对现有基于差别矩阵方法的知识约简算法的不足,并且当决策信息系统中样本量较大、决策类别数较少时,算法构造的差别矩阵中将存在大量空值元素。提出了一种新的差别矩阵构造方法,有效地剔除了差别矩阵中的空值元素,在此基础上,设计了一种决策信息系统的知识约简算法,由于算法能有效地利用核属性,进一步缩小了知识约简算法的效率,并通过算例分析说明了算法的可行性。  相似文献   

14.
Rough set reduction has been used as an important preprocessing tool for pattern recognition, machine learning and data mining. As the classical Pawlak rough sets can just be used to evaluate categorical features, a neighborhood rough set model is introduced to deal with numerical data sets. Three-way decision theory proposed by Yao comes from Pawlak rough sets and probability rough sets for trading off different types of classification error in order to obtain a minimum cost ternary classifier. In this paper, we discuss reduction questions based on three-way decisions and neighborhood rough sets. First, the three-way decision reducts of positive region preservation, boundary region preservation and negative region preservation are introduced into the neighborhood rough set model. Second, three condition entropy measures are constructed based on three-way decision regions by considering variants of neighborhood classes. The monotonic principles of entropy measures are proved, from which we can obtain the heuristic reduction algorithms in neighborhood systems. Finally, the experimental results show that the three-way decision reduction approaches are effective feature selection techniques for addressing numerical data sets.  相似文献   

15.
关于决策表约简的CEBARKNC算法改进   总被引:3,自引:0,他引:3  
CEBARKNC算法是基于条件信息熵的决策表约简算法,但是该算法对于某些决策表的约简是不完全的。通过对CEBARKNC算法的分析,找出该算法的约简不完全的原因,并讨论了启发信息的构造,进而在此基础上提出了以粗糙集的代数理论为基础,以条件信息熵为属性约简的启发式信息的改进算法。  相似文献   

16.
决策域分布保持的启发式属性约简方法   总被引:1,自引:0,他引:1  
马希骜  王国胤  于洪 《软件学报》2014,25(8):1761-1780
在决策粗糙集中,由于引入了概率阈值,属性增加或减少时,正域或者非负域有可能变大、变小或者不变,即属性的增减与决策域(正域或非负域)之间不再具有单调性.分析结果表明,现有的基于整个决策域的属性约简定义可能会改变决策域.为使决策域保持不变,引入了正域分布保持约简与非负域分布保持约简的概念.此外,决策域的非单调性使得属性约简算法必须检查一个属性集合的所有子集.为了简化算法设计,提出了正域和非负域分布条件信息量的定义,并证明其满足单调性,从而为设计决策域分布保持约简的启发式计算方法提供了理论基础.为了进一步获得最小约简,提出一种基于遗传算法的决策域分布保持启发式约简算法,并在两种单调的决策域分布条件信息量基础上构造了新算子,即修正算子,确保遗传算法找到的是约简而不是约简的超集.对比实验从分类正确率与误分类代价两个方面都反映了决策域分布保持约简定义的合理性,并且,所提出的遗传算法在大多数情况下都找到了最小约简.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号