共查询到20条相似文献,搜索用时 397 毫秒
1.
基于增量式更新带权差别集合的属性约简算法 总被引:1,自引:1,他引:0
在面向差别矩阵的约简算法思想的基础上,定义一种新的带权差别集合(WDS)模型,并提出了高效更新带权差别集合的算法,分析了该更新算法的时间和空间复杂度.随后,基于快速更新带权差别集合算法,提出一种增量式属性约简方法.当有新的数据对象被加入决策表,可有效提高属性约简的效率.理论分析和实验结果表明该算法适用于大数据集的约简. 相似文献
2.
景运革 《微电子学与计算机》2015,(2):47-51,55
目前粗糙集模型属性约简大多是基于静态信息系统,而实际决策表的数据信息都是动态变化的,为了有效地对这些数据集进行处理,在信息系统属性值粗化时,首先介绍了关系矩阵增量机制,提出了一种粗糙集增量式约简的矩阵方法并构造其相应的算法,最后,通过实例分析来说明属性约简的具体操作方法和算法的有效性与可行性. 相似文献
3.
4.
属性约简是粗糙集理论在信息处理和自动化控制领域中的重要应用,然而实际应用环境下,数据的采集是源源不断地并且采集到的数据包含了不同的数据类型,同时数据传输过程中也存在着数据丢失的情况,使得最终得到的信息系统是不完备混合类型的,并且时刻处于增加更新之中。针对这一情形,提出一种条件信息熵的不完备混合型信息系统动态属性约简算法。文中首先介绍了不完备混合型信息系统的条件熵模型以及条件熵的属性约简,然后提出了不完备混合型信息系统条件熵随论域增加时的增量式更新计算,该计算方法通过旧信息系统的条件熵进一步计算新信息系统的条件熵,理论证明了这种增量式计算具有很高的计算效率,最后基于这种增量式计算,设计出了条件熵的不完备混合型信息系统动态属性约简算法。实验分析表明,所提出的动态属性约简算法相比较于传统的静态属性约简算法具有很高的动态属性约简性能,同时与同类型的动态属性约简算法相比具有较好的优越性。 相似文献
5.
增量式属性约简是一种针对动态环境下的数据挖掘方法.目前已经提出的增量式属性约简算法仅适用于符号型的信息系统,而很少有对混合信息系统进行相关的研究,这促使在混合信息系统下构建相关的增量式属性约简算法.区分度是用于设计属性约简的一种重要方法,本文将传统的区分度在混合信息系统下进行推广,提出邻域区分度的概念,然后分别研究了邻域区分度在混合信息系统下对象增加和对象减少时的增量式学习,最后根据这种增量式学习分别提出了对应的增量式属性约简算法.UCI数据集上的相关实验结果表明,所提出的增量式属性约简比非增量式属性约简能够更快速的更新约简结果. 相似文献
6.
7.
目前决策表的数据信息都是动态变化的,为了有效地对这些数据集进行属性约简处理,在改进的等价关系矩阵的基础上,提出一种增量式属性约简算法,决策表增加了一些属性,利用更新前决策表的等价关系矩阵和属性约简等信息,便能快速求解出更新后的决策表属性约简.实验结果进一步验证了该方法的有效性和正确性. 相似文献
8.
9.
基于属性重要性的不完备数据填充算法 总被引:1,自引:0,他引:1
现有的不完备数据填充算法对所有缺失数据采用统一方式填充,没有考虑数据的重要性,效率低,实时性差。因此,本文提出一种基于属性重要性的不完全数据填充算法。通过差分矩阵求得属性约简,根据约简区分重要属性和非重要属性,对于重要属性数据填充采用改进的马氏距离填充方法,而不重要属性数据填充采用相似度概率填充方法,保证了数据精确度的同时,提高了实时性,具有实用性。最后,实验部分采用数据家庭系统数据和UCI标准数据集分别对算法性能进行了分析,验证了该算法的优越性。 相似文献
10.
基于分明矩阵的序贯属性约简算法 总被引:1,自引:1,他引:0
根据决策表信息系统的分明矩阵及序贯思想,提出了序贯属性约简算法,该算法首先构造递增序列的分明函数,然后利用逐次增加的属性核对分明函数进行分支运算,并建立属性约简树,从而求出所有约简.该算法避免了大量的逻辑运算,实现了高维数据的高效属性约简.理论分析和实验结果表明该算法具有更高的运行效率. 相似文献
11.
基于粗糙集理论,对基于属性重要度的启发式属性约简算法进行了改进,并将改进后算法运用于纳税人属性约简的实际工作中.该算法解决了原有基于属性重要度的启发式属性约简算法结果中存在冗余属性问题,实现了属性选择较小化,并保持原有数据分类能力不发生大的变化.通过属性约简实验结果和实际工作情况对比,证明该算法具有很好的性能. 相似文献
12.
提出了一种基于支持向量数据描述(SVDD)的数据约简方法,该方法利用一类学习算法SVDD的特性,通过迭代优化运算有效地实现了对原始训练样本数据的约简。实验数据的结果表明,该方法简单易行,具有稳定性和准确性,能大大缩减原始训练集规模的同时保持原分类问题的识别精度。 相似文献
13.
针对经典的粗糙集方法在处理不完备测试数据时,将完备化和属性约简先后进行易导致完备化数据产生偏差而影响属性约简准确性的问题,给出一种基于不完备熵的属性约简算法.通过对属性重要度概念在粗糙熵和不完备熵定义上进行拓展,立足原始测试数据直接计算各条件属性的属性重要度,从而获取一个较优的属性约简.该方法不仅充分考虑了不完备数据与属性约简之间的联系,而且约简结果更加精确,最后在某型装备故障诊断中应用验证了其有效性和优越性. 相似文献
14.
15.
16.
针对不确定信息系统中存在的问题,在不确定信息系统的属性集上定义了一种等价关系,以等价类决定属性的条件信息量,从而定义属性的相对重要性,给出一种新型的动态属性约简算法。在一个信息系统不断变化时,该算法不像静态约简算法需要重新计算,而是利用新增的数据对已有的数据进行修正,使得每次约简充分利用上一次的结果,这样使得同样的比较运算不会重复进行。通过分析表明,该算法是正确有效的。 相似文献
17.
18.
属性约简是粗糙集的一个重要应用.一个数据集往往含有多个属性约简,人们一般用启发式算法找到其中的一个,再通过实验的方法验证其有效性.面对多个属性约简,人们往往难以区别,缺乏有效的手段选取最优或较优的属性约简.使用多种概念漂移的度量指标和信息损失的度量方法比较了同一个知识系统中不同Pawlak约简之间的区别与联系.提出了属性约简重心的概念,并研究其性质.实验结果显示,在众多的属性约简中,离重心最近的属性约简在分类准确率方面具有较大的优势.概念漂移的度量指标和信息损失的度量方法有助于区分不同的属性约简,属性约简的重心有助于在众多的属性约简中选择最优或较优的一个. 相似文献
19.
20.
为解决决策表属性约简完备算法约简质量低的问题,在基于差别矩阵的属性约简完备算法的基础上,引入信息论中信息熵和互信息增益的定义,给出一种启发式属性约简完备方法,通过实例说明启发式信息可以提高完备算法的约简质量,比较不同启发信息对完备算法的约筒质量和约简效率。试验结果表明,采用基于信息论定义的两种启发信息的完备算法约筒效率基本一致,该算法较非启发式完备算法有更好的约简质量。 相似文献