共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
一种基于粗集理论的属性约简改进算法 总被引:11,自引:0,他引:11
利用粗集理论中属性的依赖度和重要度性质,提出一种对数据属性进行约简的改进算法,对该算法进行分析,并运用一个简单的例子对该算法的有效性进行验证。 相似文献
4.
采用二分类情形与三支决策区域,研究变精度粗糙集(VPRS)两类属性约简及其结构启发算法。首先,依托三支决策区域构建分类区域,提出分类区域保持(CRP)约简与决策区域保持(DRP)约简,得到对定性属性约简的量化扩张性,设计基于核的结构启发算法;然后,研究两类区域约简的强弱关系,设计由强至弱的结构启发算法,得到二支决策拓展为三支决策的约简改进;最后,利用数据表实例与UCI数据集验证区域约简及其启发算法的有效性。 相似文献
5.
变精度粗糙集模型属性约简分析 总被引:1,自引:0,他引:1
分析了变精度粗糙集模型属性约简过程出现跳跃的原因,并给出消除跳跃现象的方法。探讨了基于分类质量、相对正域和决策类下近似的属性约简定义,并采用属性添加法对条件属性进行约简,约简过程反映了分类能力的变化。 相似文献
6.
地下施工中影响施工的风险影响因素十分繁杂,为了从中剔除不必要或不重要的因素,提出一种新的基于免疫的粗糙集属性约简算法--IRSAR.该算法在求出决策表的相对核core的基础上初始化抗体群,并定义了新的亲和度计算函数和克隆增殖函数,有效地提高了亲和度的收敛速度.利用记忆数组存放每一代中满足条件的抗体,制定了记忆数组更新策略,从而得到最优抗体.实验结果表明,IRSAR算法能够较快地得出合理有效的约简结果. 相似文献
7.
针对高维数据集的属性约简问题,通过改变经典粒子群算法的运动方程,并用属性依赖性和属性子集特征数构造适应度函数,提出以决策表核属性为基础的最小属性子集搜寻策略。实验结果表明,与其他类型的最小属性约简算法相比,该算法不仅能有效提高获得最小属性约简的机率,同时还大大降低了计算时间。 相似文献
8.
通过对实域区间和决策值的重新划分,对已经存在的属性广义重要度度量准则进行了扩展,构建了对象空间上的广义邻域关系及广义邻域关系下的实域粗糙集模型,并在此基础上提出了实域决策系统中属性约简方法(ARRDDS).对不同数据集的实验测试结果表明,与其他相关方法相比,ARRDDS方法能够较好地处理决策表中实数域属性约简问题. 相似文献
9.
增量式学习中,当向决策表中增加一个新例子时,为了获得极小决策规则集,一般方法是对决策表中的所有数据重新计算。但这种方法显然效率很低,而且也是不必要的。论文从粗集理论出发,提出了一种最小重新计算的标准,并在此基础上,给出了一个增量式学习的改进算法。该算法在一定程度上优于传统的增量式学习算法。 相似文献
10.
11.
为了在动态变化的决策表中,快速方便地获得新的属性约简,利用数组元素对差别矩阵中的属性组合进行计数,提出一种基于数组的增量式属性约简更新算法。当决策表动态变化时,根据数组元素的取值变化,获得差别矩阵中增加和减少的元素,依据这些元素更新原属性约简,快速得到新的最小属性约简。理论分析及实例验证了提出的算法是有效的。 相似文献
12.
随着信息大爆炸时代的到来,数据集的巨大化和数据集结构的复杂化已经成为近似计算中不能忽视的问题,而动态计算是解决这些问题的一种行之有效的途径。对现有的应用于经典多粒度粗糙集动态近似集更新方法进行了改进,提出了应用于变精度多粒度粗糙集(VPMGRS)的向量矩阵近似集计算与更新方法。首先,提出了一种基于向量矩阵的VPMGRS近似集静态计算算法;其次,重新考虑了VPMGRS近似集更新时的搜索区域,并根据VPMGRS的性质缩小了该区域,有效地提升了近似集更新算法的时间效率;再次,根据新的搜索区域,在VPMGRS近似集静态计算算法的基础上提出了一种新的VPMGRS近似集更新的向量矩阵算法;最后,通过实验验证了所提算法的有效性。 相似文献
13.
为了解决当不完备混合决策系统中数据动态增加时,静态属性约简方法的计算复杂度高的问题,提出变精度下不完备混合数据的增量式属性约简方法。首先,在变精度模型下给出了利用条件熵度量属性的重要性程度;然后,详细分析和设计了当数据动态增加时条件熵的增量式更新变化情况和属性约简的更新机制;在此基础上,利用启发式贪心策略构造了增量式的属性约简算法,实现了不完备的数值型和符号型混合数据下属性约简的动态更新。通过UCI数据集中五个真实的混合型数据集的实验比较和分析,在约简效果方面,利用增量式属性约简算法处理Echocardiogram、Hepatitis、Autos、Credit和Dermatology数据集的增量规模为90%+10%时,数据集的原属性个数分别由12、19、25、17和34个约简至6、7、10、11和13个,分别占原属性集的50.0%、36.8%、40.0%、64.7%和38.2%;在执行时间方面,增量式算法在五个数据集的平均耗时分别为2.99 s、3.13 s、9.70 s、274.19 s和50.87 s,静态算法的平均耗时分别为284.92 s、302.76 s、1062.23 s、3510.79 s和667.85 s,且增量式算法的耗时与数据集的实例规模、属性个数和属性值类型的分布相关。实验结果表明,增量式属性约简算法在计算耗时方面要显著优于静态算法,且能有效剔除数据中的冗余属性。 相似文献
14.
针对粗糙集理论核心内容之一的知识约简问题,提出了一种基于遗传算法的粗糙集属性约简算法。利用条件熵计算属性间的相关性,并将其引入到适值函数中,可以保证所求约简含有较少的属性而且属性间的相关性较小。实验证明,它可以得到比较理想的结果,对UCI机器学习数据集的测试结果也验证了算法的有效性。 相似文献
15.
针对大量存在的不一致决策表,研究了分配量函数和[β]分配量函数定义。依据Ziarko变精度粗糙集模型,提出利用计算条件属性组合的[β]重要度来选择属性的[β]重要度属性约简和利用[β]二进制可辨矩阵实现的[β]分配量属性约简,可有效解决不一致决策表属性约简问题。 相似文献
16.
阐述了粗糙集理论、遗传约简算法和粒子群约简算法。属性约简是知识发现的关键问题之一。传统的属性约简算法都是串行搜索的,算法效率低且收敛速度慢。将计算智能和粗糙集相结合,提出了一种基于遗传粒子群和粗糙集的最小属性约简算法。该算法利用属性依赖度计算属性核,并在种群初始化时引入属性核作为限制条件,动态调整适应度函数,以达到求得最小属性约简的目的。实验表明,对于数据量大、属性维度高的属性约简问题,该算法具有高效的处理能力。 相似文献
17.
18.
基于粗糙集和信息增益的属性约简改进方法 总被引:2,自引:0,他引:2
针对属性过多对于有效的数据挖掘很不利以及约简中差别矩阵的产生会占用较大存储空间的问题,提出了一种基于粗糙集和信息增益的属性约简改进算法.该算法首先采用信息增益技术对决策表属性进行相关分析,删除部分冗余属性,减小属性约简的复杂度,然后直接从决策表中提取出分明函数,求出属性约简.由于避免了分明矩阵的生成,因此该算法不仅节约了时间和空间,而且提高了效率. 相似文献
19.
王艳平 《计算机工程与科学》2014,36(3):541-544
以直觉模糊目标信息系统为研究对象,以粗糙集和直觉模糊集为工具,以知识发现为目的,给出了从直觉模糊决策表中获取决策规则的一种有效方法。即通过对Pawlak粗糙隶属函数的定义进行推广,给出粗糙直觉模糊隶属函数,利用新的粗糙隶属函数,建立了变精度粗糙直觉模糊集模型。在此模型基础上定义了变精度粗糙直觉模糊集的近似质量和近似约简,由近似约简导出概率决策规则集,从而给出了直觉模糊决策表的概率决策规则获取方法。最后,以实例说明了这一方法的有效性。关键词: 相似文献
20.
李丹 《计算机工程与应用》2017,53(21):68-71
现实生活中许多数据库都是动态变化的,为了获取新的知识,传统的方法需要重复计算,耗时巨大。为了克服这个缺陷,有效处理动态数据,许多学者提出了增量学习方法。针对决策表属性值动态变化,提出了基于属性值细化的矩阵增量约简算法,当一部分属性值被细化时,同非增量约简方法相比,增量方法能快速找到新的约简,最后通过UCI数据进行性能测试,实验仿真结果表明所提增量约简算法是有效的。 相似文献