首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 397 毫秒
1.
基于增量式更新带权差别集合的属性约简算法   总被引:1,自引:1,他引:0  
在面向差别矩阵的约简算法思想的基础上,定义一种新的带权差别集合(WDS)模型,并提出了高效更新带权差别集合的算法,分析了该更新算法的时间和空间复杂度.随后,基于快速更新带权差别集合算法,提出一种增量式属性约简方法.当有新的数据对象被加入决策表,可有效提高属性约简的效率.理论分析和实验结果表明该算法适用于大数据集的约简.  相似文献   

2.
目前粗糙集模型属性约简大多是基于静态信息系统,而实际决策表的数据信息都是动态变化的,为了有效地对这些数据集进行处理,在信息系统属性值粗化时,首先介绍了关系矩阵增量机制,提出了一种粗糙集增量式约简的矩阵方法并构造其相应的算法,最后,通过实例分析来说明属性约简的具体操作方法和算法的有效性与可行性.  相似文献   

3.
针对隐写分析评估指标体系中存在的知识冗余,提出了一种隐写分析评估指标的属性约简方法.在分析存在知识冗余的指标体系的基础上,采用BCC算法求出各评估指标初始区间及其约简,并用之将仿真实验数据离散化;之后将离散化矩阵作为HORAFA算法的输入,输出即得到最终的属性约简.仿真实验验证了该属性约简方法对冗余评估指标约简的有效性...  相似文献   

4.
游琪  孙柏杨 《电子器件》2022,45(5):1129-1138
属性约简是粗糙集理论在信息处理和自动化控制领域中的重要应用,然而实际应用环境下,数据的采集是源源不断地并且采集到的数据包含了不同的数据类型,同时数据传输过程中也存在着数据丢失的情况,使得最终得到的信息系统是不完备混合类型的,并且时刻处于增加更新之中。针对这一情形,提出一种条件信息熵的不完备混合型信息系统动态属性约简算法。文中首先介绍了不完备混合型信息系统的条件熵模型以及条件熵的属性约简,然后提出了不完备混合型信息系统条件熵随论域增加时的增量式更新计算,该计算方法通过旧信息系统的条件熵进一步计算新信息系统的条件熵,理论证明了这种增量式计算具有很高的计算效率,最后基于这种增量式计算,设计出了条件熵的不完备混合型信息系统动态属性约简算法。实验分析表明,所提出的动态属性约简算法相比较于传统的静态属性约简算法具有很高的动态属性约简性能,同时与同类型的动态属性约简算法相比具有较好的优越性。  相似文献   

5.
混合数据的邻域区分度增量式属性约简算法   总被引:1,自引:0,他引:1       下载免费PDF全文
盛魁  王伟  卞显福  董辉  马健 《电子学报》2020,48(4):682-696
增量式属性约简是一种针对动态环境下的数据挖掘方法.目前已经提出的增量式属性约简算法仅适用于符号型的信息系统,而很少有对混合信息系统进行相关的研究,这促使在混合信息系统下构建相关的增量式属性约简算法.区分度是用于设计属性约简的一种重要方法,本文将传统的区分度在混合信息系统下进行推广,提出邻域区分度的概念,然后分别研究了邻域区分度在混合信息系统下对象增加和对象减少时的增量式学习,最后根据这种增量式学习分别提出了对应的增量式属性约简算法.UCI数据集上的相关实验结果表明,所提出的增量式属性约简比非增量式属性约简能够更快速的更新约简结果.  相似文献   

6.
《现代电子技术》2016,(7):115-119
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法。讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明,改进算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。  相似文献   

7.
目前决策表的数据信息都是动态变化的,为了有效地对这些数据集进行属性约简处理,在改进的等价关系矩阵的基础上,提出一种增量式属性约简算法,决策表增加了一些属性,利用更新前决策表的等价关系矩阵和属性约简等信息,便能快速求解出更新后的决策表属性约简.实验结果进一步验证了该方法的有效性和正确性.  相似文献   

8.
针对传统数据挖掘算法在数据量级方面的局限性,提出在粗糙集理论的基础上,采用类分布链表结构改进传统的基于属性重要性的数据离散化算法、属性约简算法以及基于启发式的值约简算法;讨论了基于动态聚类的两步离散化算法,当算法适应大数据处理之后,采用并行计算的方法提高算法的执行效率。算法测试结果表明改进的算法能有效地处理大数据量,同时并行计算解决了大数据量处理带来的效率问题。  相似文献   

9.
基于属性重要性的不完备数据填充算法   总被引:1,自引:0,他引:1  
现有的不完备数据填充算法对所有缺失数据采用统一方式填充,没有考虑数据的重要性,效率低,实时性差。因此,本文提出一种基于属性重要性的不完全数据填充算法。通过差分矩阵求得属性约简,根据约简区分重要属性和非重要属性,对于重要属性数据填充采用改进的马氏距离填充方法,而不重要属性数据填充采用相似度概率填充方法,保证了数据精确度的同时,提高了实时性,具有实用性。最后,实验部分采用数据家庭系统数据和UCI标准数据集分别对算法性能进行了分析,验证了该算法的优越性。  相似文献   

10.
基于分明矩阵的序贯属性约简算法   总被引:1,自引:1,他引:0  
根据决策表信息系统的分明矩阵及序贯思想,提出了序贯属性约简算法,该算法首先构造递增序列的分明函数,然后利用逐次增加的属性核对分明函数进行分支运算,并建立属性约简树,从而求出所有约简.该算法避免了大量的逻辑运算,实现了高维数据的高效属性约简.理论分析和实验结果表明该算法具有更高的运行效率.  相似文献   

11.
基于粗糙集理论,对基于属性重要度的启发式属性约简算法进行了改进,并将改进后算法运用于纳税人属性约简的实际工作中.该算法解决了原有基于属性重要度的启发式属性约简算法结果中存在冗余属性问题,实现了属性选择较小化,并保持原有数据分类能力不发生大的变化.通过属性约简实验结果和实际工作情况对比,证明该算法具有很好的性能.  相似文献   

12.
提出了一种基于支持向量数据描述(SVDD)的数据约简方法,该方法利用一类学习算法SVDD的特性,通过迭代优化运算有效地实现了对原始训练样本数据的约简。实验数据的结果表明,该方法简单易行,具有稳定性和准确性,能大大缩减原始训练集规模的同时保持原分类问题的识别精度。  相似文献   

13.
针对经典的粗糙集方法在处理不完备测试数据时,将完备化和属性约简先后进行易导致完备化数据产生偏差而影响属性约简准确性的问题,给出一种基于不完备熵的属性约简算法.通过对属性重要度概念在粗糙熵和不完备熵定义上进行拓展,立足原始测试数据直接计算各条件属性的属性重要度,从而获取一个较优的属性约简.该方法不仅充分考虑了不完备数据与属性约简之间的联系,而且约简结果更加精确,最后在某型装备故障诊断中应用验证了其有效性和优越性.  相似文献   

14.
《现代电子技术》2017,(21):112-116
模糊C均值聚类算法在处理高维数据集时,存在计算复杂度高,算法泛化能力差,计算精度低等问题。考虑到特征属性对聚类的贡献程度的差异,在多属性模糊C均值聚类的思想上,提出一种基于属性重要性的约简算法。为验证有效性,在UCI数据集上,将新算法与因子分析法和粗糙集理论约简方法进行比较分析。实验结果表明,该方法具有更好的泛用性,在平均标准差大或类间中心距离较远的数据集上具有更好的性能。  相似文献   

15.
相比于经典粗糙集方法,模糊粗糙集方法避免了数据离散化的过程,减少了信息损失。但基于传统模糊粗糙集的属性约简并未考虑实际应用中数据的测试代价,为解决这一问题,提出了一种近似质量与测试代价相融合的适应度函数,并利用遗传算法以求得具有较小测试代价的约简。最后,采用UCI中的8组数据集对基于新适应度函数的遗传算法与经典的启发式算法进行对比分析,实验结果表明,遗传算法相较于启发式算法能够在保证近似质量不发生明显变化的情况下获得具有较低测试代价的约简。  相似文献   

16.
针对不确定信息系统中存在的问题,在不确定信息系统的属性集上定义了一种等价关系,以等价类决定属性的条件信息量,从而定义属性的相对重要性,给出一种新型的动态属性约简算法。在一个信息系统不断变化时,该算法不像静态约简算法需要重新计算,而是利用新增的数据对已有的数据进行修正,使得每次约简充分利用上一次的结果,这样使得同样的比较运算不会重复进行。通过分析表明,该算法是正确有效的。  相似文献   

17.
针对传统高精度分类算法在面对不定因子时,无法确定计算数据信噪度,造成计算精度不佳的问题,提出基于属性约简的粗糙集数据的高精度分类算法。通过对影响粗糙集数据分类精度的各影响因素进行详细分析,对粗糙集数据属性进行约简,抵消对应不定因子以及信噪数据,提高粗糙集数据分类精度。实验结果表明,采用改进分类算法相比传统分类方法,其分类精度及抗噪性均有提高,且其记录结果数据致盲率较低,具有一定优势。  相似文献   

18.
邓大勇  葛雅雯  黄厚宽 《电子学报》2019,47(5):1111-1120
属性约简是粗糙集的一个重要应用.一个数据集往往含有多个属性约简,人们一般用启发式算法找到其中的一个,再通过实验的方法验证其有效性.面对多个属性约简,人们往往难以区别,缺乏有效的手段选取最优或较优的属性约简.使用多种概念漂移的度量指标和信息损失的度量方法比较了同一个知识系统中不同Pawlak约简之间的区别与联系.提出了属性约简重心的概念,并研究其性质.实验结果显示,在众多的属性约简中,离重心最近的属性约简在分类准确率方面具有较大的优势.概念漂移的度量指标和信息损失的度量方法有助于区分不同的属性约简,属性约简的重心有助于在众多的属性约简中选择最优或较优的一个.  相似文献   

19.
粗糙集是粒计算的一种重要方法,数据异构性是大数据的一种特征.针对异构数据问题,探索了粗糙集属性约简的本质,提出了概念属性约简的定义,它兼容值约简、Pawlak约简和并行约简.探究了概念属性约简的性质,提出了异构数据的属性约简方法和概念漂移探测方法.理论分析和示例表明了这些方法的有效性.为粗糙集、粒计算融入大数据的时代潮流提供了一种新方法.  相似文献   

20.
为解决决策表属性约简完备算法约简质量低的问题,在基于差别矩阵的属性约简完备算法的基础上,引入信息论中信息熵和互信息增益的定义,给出一种启发式属性约简完备方法,通过实例说明启发式信息可以提高完备算法的约简质量,比较不同启发信息对完备算法的约筒质量和约简效率。试验结果表明,采用基于信息论定义的两种启发信息的完备算法约筒效率基本一致,该算法较非启发式完备算法有更好的约简质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号