首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
属性约简在一类林业数据决策分析中的应用   总被引:2,自引:0,他引:2  
本文探讨属性约简在一类林业数据决策分析中的应用,对于一类以总销量为决策属性的林业数据表,首先应用增比策略将数据二值化,然后利用属性约简算法给出了各条件因素与总销量之间的依赖关系和约简化的数据表,取得了良好的效果。  相似文献   

2.
传统增量算法主要侧重于从更新近似的角度进行属性约简,但在处理大规模数据集时需要评估所有属性并反复计算重要度,提升时间复杂度,降低效率.针对上述问题,文中提出基于属性树的并行化增量加速策略,关键步骤是将所有属性聚类成多棵属性树进行并行化动态属性评估.首先,根据属性树相关性度量选择合适的属性树进行属性评估,降低时间复杂度.再增加分支系数至停止准则中,随着分支深度的增加进行动态增加,可使算法在达到最大阈值后自主跳出循环,有效避免原先的冗余计算,提高效率.基于上述策略,提出基于属性树的增量属性约简算法,同时与Spark并行机制结合,设计基于属性树的并行化增量式动态属性约简算法.在多个数据集上的广泛实验表明,文中算法在保持分类性能的同时,可提高动态变化数据集约简的搜索效率,具有较好的性能优势.  相似文献   

3.
蒋瑜 《控制与决策》2019,34(6):1253-1258
差别矩阵为属性约简提供了很好的思路,差别信息树能有效消除差别矩阵中的冗余元素,并实现对差别矩阵的压缩存储.然而,差别信息树既没有考虑“核”属性在消除差别矩阵中冗余元素的作用,也没有考虑属性序在压缩存储差别矩阵中非空元素的作用.对此,基于“核”属性和属性序关系,提出改进差别信息树,该树能进一步实现对差别矩阵中非空元素的压缩存储.最后,给出基于UCI数据库的仿真结果,并通过仿真结果验证该树的有效性.  相似文献   

4.
在用差别矩阵思想设计的属性约简算法中,由于差别矩阵存在大量重复和无用的差别元素,不仅占用大量的存储空间,而且浪费属性约简的计算时间。为提高这种属性约简算法的效率,结合FP树(频繁模式树)的思想,给出一种新型的数据结构——改进的FP树(IFP_Tree)。改进的FP树可以完全删除差别矩阵中所有重复的差别元素,也可以完全删除无用的差别元素。不但减少了大量的存储空间,还大大提高了属性约简算法的效率。用IFP树设计一种新的快速属性约简算法。实例说明了该算法的有效性。  相似文献   

5.
研究海洋参数数据检测评价融合问题。在海洋环境监测系统中,由于监测项目繁多,测量数据存在着大量的冗余,使海洋环境的监测准确性差。传统的数据融合算法复杂度较高,难以实时利用,为了消除数据冗余性,针对钦州湾海洋数据的特点,提出了一种粗糙集的属性约简改进算法。结合贪心算法和遗传算法,在编码、交叉、变异、选择方面做了改进,能生成属性个数较少的约简,提高算法效率。通过钦州湾海洋数据融合实例,提出的算法可有效挖掘钦州湾海洋数据间的关联性,通过实验,结果表明了算法的有效性,为海洋环境监测及后续处理提供有力的决策依据。  相似文献   

6.
针对基于分辨矩阵约简算法中存在冗余元素,从而导致空间存储代价高的问题,提出一种基于加权浓缩树的属性约简算法。该算法可以进一步剔除冗余元素,压缩存储分辨矩阵中的信息,并且在构建树结构的过程当中考虑了属性重要度的影响。实验结果与C-Tree及差别信息树算法进行比较,提出的算法可以获得更优的属性约简结果,有效地降低了空间复杂度。  相似文献   

7.
为了寻找一种有效的最小属性约简方法,给出了条件属性集上的属性重要度序关系,基于此序关系构建了属性集上的集合枚举树,提出了一种快速的最小属性约简算法,该算法采用至上而下、层次优先策略搜索集合枚举树寻找属性最小约简。为了提高算法性能,该算法采用核和父集剪枝策略减少搜索空间,采用优化计算来确保同一集合的正域只计算一次。基于UCI数据的实验结果表明,该算法是有效的。  相似文献   

8.
提出一种数据约简算法.该算法从决策表中条件属性的等价类族考虑,分析决策值的等价类族,在约简过程中,可同时进行属性约简与属性值约简.与基于分析法或区分矩阵的传统约简等算法相比,本文算法可省略属性值约简中繁琐的比较过程,减少比较次数,提高约简效率.  相似文献   

9.
大数据预处理中属性约简的特性保持分析   总被引:1,自引:0,他引:1       下载免费PDF全文
伴随着工业及社会信息化程度的增强,各个领域的自动化程度越来越高,大规模及超大规模海量数据应运而生,呈现出大数据特征。这些海量数据在提升行业发展动力的同时,也带来了巨大的挑战性问题—数据可用性。为了从海量数据中甄别出无用信息、挖掘有利于相关领域发展的有价值信息,就需要对其进行数据分析。数据预处理技术可以极大地减少数据分析时的处理量,提高数据分析处理的效率,而属性约简在数据预处理中是一个比较重要的环节。在分析大数据属性特征的基础上,较系统地分析了目前几种主流的属性约简算法,对各类算法的性能进行了剖析,并展望了今后大数据预处理的研究工作思路。  相似文献   

10.
提出了一个基于云模型的数据属性约简新算法,该算法借助云模型将每个连续属性上的定量数据转化为定性概念,然后利用此定性概念计算每个条件属性对决策属性的重要性,最后以贪婪算法的思想求解约简属性,从而解决了当前约简算法对连续属性必须离散化的问题.同时对算法中可能遇到的冲突问题给出了初步的解决方案.实验表明,该算法在降低时间复杂度的同时能求出更好的属性集约简.  相似文献   

11.
属性约简是粗糙集领域的一个热门研究课题,而差别矩阵是获得属性约简的有效方法。然而,差别矩阵含有重复元素,增加了获得约简所需要的时间。差别信息树的提出解决了差别矩阵含有重复元素的问题,实现了对差别矩阵中非空元素的压缩存储。但是差别信息树是在等价关系下的差别矩阵的基础上提出的,并没有考虑序决策信息系统的情况。在区间值序信息系统的背景下提出了基于可分辨矩阵的差别信息树,解决了可分辨矩阵中存在冗余元素的问题,实现了对可分辨矩阵中非空元素的压缩存储。得到了该树的相关性质定理并对其进行了验证,并在此基础上给出区间值序信息系统的基于差别信息树的完备的属性约简方法。最后给出了实证分析,验证了该方法的可行性以及有效性。  相似文献   

12.
针对非相容决策表,本文提出一种新的属性值约简与属性约简方法,与传统数据约简方法不同的是,本文方法考虑属性值约简与属性约简之间的关联,该方法首先进行属性值约简,然后进行属性约简。这种数据约简方法在属性值约简阶段不需要频繁地与引起非相容的个体集比较,在属性约简阶段也不需要频繁地判断非相容性是否是由于非相容性的个体集所引起的,本文所要做的仅仅是执行一次删除操作。本文并证明其正确性,分析了其时间复杂度与空间复杂度,本文方法是有效可行的。  相似文献   

13.
由于计算机网络及存储技术的迅猛提高,分布数据处理已经涉及很多领域,如何有效挖掘分布数据的相关知识是人工智能领域研究的一个热点。本文我们首先介绍了如何计算分布数据的等价关系及诱导矩阵的方法,设计了一种基于分布数据的约简算法,然后,给出一些例子来解释计算分布数据的正域的过程,最后,在机器学习网站下载了3个UCI数据集并进行了大量的实验,实验结果表明了该算法能够有效解决分布数据约简问题。  相似文献   

14.
基于属性约简的粗糙集海量数据分割算法研究   总被引:1,自引:1,他引:0  
结合Rough Set理论研究了分布式处理海量数据中的关键同题,即分割海量数据集的问题.经典的Rough Set算法要求数据常驻内存,因此不能有效地处理海量数据.为了能够直接处理海量数据集,根据最佳分割的定义,结合属性约简的思想,提出基于属性约简的粗糙集海量数据分割算法(Mass Data Partition for Rough Set on Attribute Reduction,MDPRS-AR).通过实验表明,MDPRS-AR算法的分割效率比传统的算法约高70%,而且与处理整个数据集的算法相比,正确性损失不大.  相似文献   

15.
结合Rough Set理论研究了分布式处理海量数据中的关键问题,即分割海量数据集的问题。经典的RoughSet算法要求数据常驻内存,因此不能有效地处理海量数据。为了能够直接处理海量数据集,根据最佳分割的定义,结合属性约简的思想,提出基于属性约简的粗糙集海量数据分割算法(Mass Data Partition for Rough Seton Attribute Reducdon,MD-PRS—AR)。通过实验表明,MDPRS—AR算法的分割效率比传统的算法约高70%,而且与处理整个数据集的算法相比,正确性损失不大。  相似文献   

16.
为解决粗糙集中的属性约简问题,提出一种完备的最小属性约简方法。将差别矩阵中所有有关属性区分的信息都浓缩进一个差别向量组,计算每个属性在区分2个对象的属性集合中出现的概率,作为属性重要性的启发式信息,建立最小属性约简树,得到属性约简。分析结果表明,该方法可以获得所有的最小属性约简。  相似文献   

17.
探讨了决策规则的数据约简问题,对条件属性与决策属性在决策表中的概率关联给出了有关结论,推导出基于先验概率的决策规则冗余条件,从而获得基于先验概率的数据约简方法,并用应用实例进行了验证。  相似文献   

18.
马昕  林丽清 《计算机仿真》2007,24(9):158-160
粗糙集作为一种新的数学工具可用于数据挖掘中的面向属性的数据约简,但随着信息系统中信息量的不断膨胀,属性组合的不断增长,单独使用粗糙集寻找最小属性集已证明是个NP难的问题.蚁群算法是一种新型的模拟进化算法,在求解复杂的组合优化问题中获得成功并表现出良好的性能.文中将属性约简的过程视为一个特殊的"寻优"过程:把属性视为节点,而要寻找的是这些节点的"最少"组合,使得其能代替原来的属性节点而不改变原有属性的分类粗糙度.在此基础上,提出一种新的组合算法,利用蚁群算法在寻优方面的优势,结合粗糙集算法,用于最小属性集的寻找.最后通过一个具体的例子,证明了此算法的有效性和可行性.  相似文献   

19.
20.
针对相容决策表,另辟一种数据约简思路,与传统数据约简方法不同的是,本文方法考虑属性值约简与属性约简之间的关联,该方法首先进行属性值约简,然后再进行属性约简,本文并给予了充分的证明,而普通的方法并没有考虑它们之间的联系,并有许多冗余的比较操作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号