首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
由于数据随时间和空间不断更新,很多基于粗糙集的增量方法被提出。然而,动态数据上基于模糊粗糙集的特征选取(也称属性约简)更新的研究较少,特别是连续型动态数据上的增量特征选取。为了解决这个问题,提出适用于连续型数据的基于模糊粗糙集的增量属性约简算法。首先提出模糊粗糙基本概念的增量机制,如模糊正域的增量机制。只有部分示例在已有属性约简上的辨识能力不足,即对于模糊正域来说,存在一个关键示例集。增量约简算法基于已有数据上的约简结果,仅需要更新关键示例集中的示例,而非全部的论域。因而该增量算法在动态数据上能快速获得约简的更新。通过数值对比实验可以看出,增量算法比非增量算法在运行时间上有明显的优势。特别是对于高维数据集,增量算法可以大大地节省计算时间。  相似文献   

2.
为了解决当不完备混合决策系统中数据动态增加时,静态属性约简方法的计算复杂度高的问题,提出变精度下不完备混合数据的增量式属性约简方法。首先,在变精度模型下给出了利用条件熵度量属性的重要性程度;然后,详细分析和设计了当数据动态增加时条件熵的增量式更新变化情况和属性约简的更新机制;在此基础上,利用启发式贪心策略构造了增量式的属性约简算法,实现了不完备的数值型和符号型混合数据下属性约简的动态更新。通过UCI数据集中五个真实的混合型数据集的实验比较和分析,在约简效果方面,利用增量式属性约简算法处理Echocardiogram、Hepatitis、Autos、Credit和Dermatology数据集的增量规模为90%+10%时,数据集的原属性个数分别由12、19、25、17和34个约简至6、7、10、11和13个,分别占原属性集的50.0%、36.8%、40.0%、64.7%和38.2%;在执行时间方面,增量式算法在五个数据集的平均耗时分别为2.99 s、3.13 s、9.70 s、274.19 s和50.87 s,静态算法的平均耗时分别为284.92 s、302.76 s、1062.23 s、3510.79 s和667.85 s,且增量式算法的耗时与数据集的实例规模、属性个数和属性值类型的分布相关。实验结果表明,增量式属性约简算法在计算耗时方面要显著优于静态算法,且能有效剔除数据中的冗余属性。  相似文献   

3.
景运革  李天瑞 《计算机科学》2013,40(11):261-264,286
研究了粗糙集属性约简问题,引入等价关系矩阵的诱导矩阵和矩阵的λ-截矩阵等概念来计算决策表的上、下近似集,进而给出基于关系矩阵的决策表正域求解方法,并从理论上证明了该方法的正确性。提出了粗糙集属性核的启发式约简,并用该方法计算最小约简,在属性动态增加时,用矩阵快速更新的方法来改变属性等价关系矩阵,可以快速地计算属性变化后的正域。最后,通过实例分析说明了属性约简的具体操作方法和算法的有效可行性。  相似文献   

4.
一种基于属性重要性的启发式约简算法   总被引:2,自引:0,他引:2  
属性约简是知识发现中的关键问题之一.为了能够有效地获取决策表中条件属性集的最小相对约简,本文首先利用代数方法描述决策表中的属性的重要性,提出了限制正域的概念,得到了关于限制正域的若干结果,并据此提出一种改进的属性约简算法,即以属性核为起点并结合算子,通过向属性核不断添加重要程度最大的属性,并利用已求得的正区域和限制正域使处理数据的范围不断缩小从而减少求约简的时间. 该算法能够节省得到决策表的最小约简的时间并能得到所有相对约简.实例分析也验证了该算法的有效性.  相似文献   

5.
现有的属性约简方法大部分关注决策系统中的所有决策类,而在实际决策过程中决策者往往仅关注决策系统中的一种或几种决策类。针对上述问题,提出基于多特定决策类的不完备决策系统正域约简的理论框架。首先,给出不完备决策系统单特定决策类正域约简的概念;第二,将单特定决策类正域约简推广到多特定决策类,构造了相应的差别矩阵及区分函数;第三,分析并证明了相关定理,提出基于差别矩阵的不完备决策系统多特定决策类正域约简算法(PRMDM);最后,选取4组UCI数据集进行实验。在数据集Teaching-assistant-evaluation、House、Connectionist-bench和Cardiotocography上,基于差别矩阵的不完备决策系正域约简算法(PRDM)的平均约简长度分别为4.00、13.00、9.00和20.00,PRMDM算法(多特定决策类中决策类数目为2)的平均约简长度分别为3.00、8.00、8.00和18.00。实验结果验证了PRMDM算法的有效性。  相似文献   

6.
冯林 《计算机应用》2010,30(4):1086-1088
属性约简是粗糙集理论研究的一个核心问题,而核属性的确定往往是决策表中属性约简的基础。结合决策表的树型结构表示,给出了决策表中正域和非正域的计算方法,并从核属性的定义出发,计算树型决策表中正域和非正域相对于属性全集正域和非正域的变化,提出了一种计算决策表中核属性的方法。对其时间和空间复杂度的分析,以及对一个气象决策表例子的实验结果,证明了这些方法的有效性。  相似文献   

7.
属性约简是粗糙集理论的重要应用。考虑将决策表中的每行都作为一条决策规则时,若把表中出现相同决策规则的次数作为权,可得到带权决策表。提出了关于带权决策表的正域约简相应的辨识矩阵并给出了证明,从而得到了约简算法。相比于决策表中的正域约简时发现,通过将决策表转化为带权决策表后,再利用算法1进行约简时,其在一定程度上优于前者。提出了近似分类精度约简相应的辨识矩阵并给出了证明。对于2个算法,在选取的UCI数据集上进行了实验验证。通过实验进一步说明了所提出算法的可行性和有效性。  相似文献   

8.
基于正域的属性约简算法是利用"下近似"思想,仅考虑被正确区分样本数的约简算法。借鉴"上近似"的思想,利用"邻域信息粒"的概念定义了区分对象集,探讨了其基本性质,并提出了基于区分对象集的属性重要度度量及启发式属性约简算法。该约简算法既考虑信息决策表的相对正域,也考虑以核属性为启发信息逐个增加条件属性时对边界域样本的影响。通过实例分析,说明了所提算法的可行性,并且以6个UCI标准数据集为实验对象,与基于正域的属性约简算法进行对比实验。实验结果说明,采用提出的约简算法得到的约简属性集,与基于正域的属性约简算法相比,在进行分类任务时的分类精度能够保持不变或有所提高。  相似文献   

9.
唐鹏飞  张贤勇  莫智文 《计算机应用研究》2021,38(11):3300-3303,3309
区间集决策信息表拓展了经典决策信息表,但其属性约简研究较少.针对区间集决策信息表存在的问题,采用模型正域及相关依赖度提出属性约简及其启发式约简算法.在区间集粗糙集模型中,定义关于决策分类的正域与依赖度,证明粒化单调性等性质.提出基于依赖度的属性约简,设计启发式约简算法.实例分析与数据实验表明,设计的基于依赖度的启发式约简算法是有效的,所得结果有利于依赖学习与特征优化.  相似文献   

10.
在基于正域的不一致决策表属性约简算法中,计算正域的算法效率是关键,直接影响到属性约简算法的时间复杂度。针对这一问题,新算法改进了区分矩阵的构造过程,提出了一种有效的在二进制区分矩阵上计算负域的方法,将约简的关键转换为对负域的计算,以属性频率为启发式信息指导属性约简过程。该算法也适用于一致决策表的属性约简。最后,通过实例证明了算法的有效性。  相似文献   

11.
刘超  王磊  杨文  钟强强  黎敏 《计算机应用》2022,42(2):463-468
为了解决集值决策信息系统中的属性数量不断发生动态变化时,静态属性约简方法无法高效更新属性约简的问题,提出一种以知识粒度为启发信息的增量式属性约简方法.首先,介绍集值决策信息系统的相关概念,接着介绍知识粒度的定义并将其矩阵表示方法推广到此系统中;然后,分析增量式约简的更新机制,并基于知识粒度设计了增量式属性约简方法;最后...  相似文献   

12.
李成  赵海琳 《测控技术》2018,37(11):50-54
属性约简是粗糙集理论在模式识别中一项重要的应用,传统的属性约简算法只适合处理静态的信息系统,而处理不断动态更新的信息系统面临着巨大的挑战。对于不完备信息系统,提出一种增量式的属性约简算法。在不完备信息系统下引入粗糙集理论中关于正区域的概念,针对不完备信息系统中属性增加的情形,提出了基于正区域的增量式属性约简算法。实验结果表明了所提出的增量式属性约简算法比非增量式的算法具有更高的效率,同时比其他同类型的算法具有更高的优越性。  相似文献   

13.
扩展正区域的属性约简方法   总被引:1,自引:0,他引:1  
扩展了Rough集正区域和边界的定义,在得到信息系统最大正区域的前提下,给出了认知正区域、认知属性核和认知属性约简的定义,并给出了从经典属性约简到认知属性约简转换的高效算法。此外,在认知正区域的定义下,由于决策表的不相容性,在变精度模型下实现属性约简的增量处理是相当困难的,结合提出的高效算法,解决了这一问题。最后,仿真实验说明了算法的有效性。  相似文献   

14.
决策表属性约简集的增量式更新算法   总被引:2,自引:0,他引:2       下载免费PDF全文
针对动态变化的决策表,研究了属性约简集的动态更新问题。在详细分析新增对象的所有可能情况的基础上,提出一种基于分辨矩阵元素集的属性约简集增量式更新算法。该算法根据新增对象的不同情况快速更新分辨矩阵元素集,依据分辨矩阵元素集中增加和减少的元素有效地更新原属性约简集,快速得到新的最小属性约简。最后,通过5个UCI的数据集验证了算法的有效性。  相似文献   

15.

提出一种新的约简算法. 首先以全局等价类为最小计算粒度, 提出粗等价类概念, 深入研究其性质并证明粗等价类下求核和约简与原决策系统等价; 剖析3 类粗等价类与正区域间的内在关联, 设计针对1 和??1 两类粗等价类双边删减下正区域的渐增式等价计算方法, 从而设计双向剪枝策略以及多次Hash 的属性增量划分算法, 基于此给出高效完备的约简算法. 最后用UCI 中20 个决策集、海量、超高维3 类数据集从多个角度进行验证, 结果表明, 所提出的约简算法的完备性和高效性在绝大多数情况下优于现有算法, 尤其适用于海量数据和超高维数据集.

  相似文献   

16.
Attribute reduction based on rough set theory has attracted much attention recently. In real‐life applications, many decision tables may vary dynamically with time, e.g., the variation of attributes, objects, and attribute values. The reduction of decision tables may change on the alteration of attribute values. The paper focuses on dynamic maintenance of attribute reduction when varying data values of multiple objects. Incremental mechanisms for knowledge granularity are proposed first, which aims to update attribute reduction effectively. Then, a group incremental reduction algorithm with varying data values is developed. When attribute values of multiple objects have been replaced by new ones in decision table, the proposed incremental algorithm can find the new reduct in a much shorter time. The time complexity analysis and experiments on different data sets from UCI have validated that the proposed incremental algorithms are efficient and effective to update the reduction with the variation of attribute values.  相似文献   

17.
当前区间类型数据的规模越来越大,若采用传统的属性约简方法进行处理,就需要对数据进行预处理,而这会损失原始信息。针对上述问题,提出了区间值决策系统β分布的约简算法。首先,给出区间值决策系统β分布的概念和约简目标,并证明了提出的相关定理;然后,对于该约简目标构建了β分布约简的差别矩阵和差别函数,提出了区间值决策系统β分布约简算法;最后,使用14组UCI数据集进行实验验证。在数据集Statlog上,当相似度阈值为0.6,对象数目为100、200、400、600、846时,β分布约简算法的平均约简长度为1.6、2.2、1.4、2.4、2.6,基于差别矩阵的分布约简算法(DRADM)的平均约简长度为2.0、3.0、3.0、4.0、4.0,基于差别矩阵的最大分布约简算法(MDRADM)的平均约简长度为2.0、3.0、3.0、4.0、3.0。实验结果验证了所提β分布约简算法的有效性。  相似文献   

18.
传感器技术发展促进各行各业产生了大量多源数据,且这些数据还在不断发生变化。当多源数据(分布信息系统)增加了一些属性后,传统约简算法需要重复计算数据且不能有效实现多源数据融合,导致计算动态多源数据约简花费时间较多,计算效率不高。为了克服传统约简算法的缺陷,设计了基于多源数据矩阵增量约简算法。介绍了一些分布信息系统的相关理论知识,给出了多源数据等价关系矩阵融合的计算方法。当多源数据增加了一些属性后,讨论了动态多源数据增量机制、融合方法及矩阵增量约简算法。分别利用矩阵增量和矩阵非增量约简方法对4个UCI数据集进行测试,测试结果验证了所提出的矩阵增量方法能够快速解决动态多源数据约简更新问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号