首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
数据挖掘是近年来数据库领域中出现的一个新兴研究热点,它是从大量数据中获取知识。进行数据挖掘的方法很多,粗糙集方法便是其中的主要方法之一。属性约简算法是基于粗糙集理论的数据挖掘模型中的关键步骤,同时也是粗糙集理论研究中的一个研究重点。通过对粗糙集理论的属性约简算法的深入研究,本文提出了一种改进的属性约简启发式算法。该算法建立在可辨识矩阵计算基础上。改进算法基于Hu的算法与Jelonek算法,在计算可辨识矩阵的基础上,保证最终能够找到决策信息系统的一个约简,同时较Jelonek算法相比,运算时间明显减少。  相似文献   

2.
基于核属性依赖的属性约简算法研究   总被引:1,自引:0,他引:1  
路松峰  胡波 《计算机仿真》2007,24(4):69-71,107
数据库中的数据往往含有大量冗余或不必要的属性,严重降低了数据挖掘算法的时间效率和算法质量,因此删除数据的冗余属性和无关属性即属性约简就成了数据预处理过程中的主要任务,而粗糙集理论是处理属性约简的一个非常实用的理论工具.在深入研究粗糙集理论的基础上,结合数据库操作知识给出了基于核属性依赖的属性约简新方法.该算法能过滤掉属性集合中的无关属性和冗余属性,从而得到满意的属性约简,该算法复杂度较小.实验结果证明了该算法有效.  相似文献   

3.
基于粗糙集理论的属性约简算法是机器学习和数据挖掘领域的研究热点之一.粗糙集理论是一种新型的处理模糊和不确定信息的数学工具,在保证分类能力不变的前提下,通过知识的约简导出概念的分类规则.文中提出了一种基于属性桶的约简算法,其约简过程类似基于属性频度函数的约简算法.该算法首先构造一组与决策表决策属性个数相同的属性桶,不同的属性桶划分了不同长度的区分矩阵项,避免了约简前的排序过程.通过构造属性桶时对核属性进行特殊处理,在一定程度上简化了属性约简过程.  相似文献   

4.
基于粗糙集理论的属性约简算法是机器学习和数据挖掘领域的研究热点之一。粗糙集理论是一种新型的处理模糊和不确定信息的数学工具,在保证分类能力不变的前提下,通过知识的约简导出概念的分类规则。文中提出了一种基于属性桶的约简算法,其约简过程类似基于属性频度函数的约简算法。该算法首先构造一组与决策表决策属性个数相同的属性桶,不同的属性桶划分了不同长度的区分矩阵项,避免了约简前的排序过程。通过构造属性桶时对核属性进行特殊处理,在一定程度上简化了属性约简过程。  相似文献   

5.
粗糙集理论作为一种新型的软计算方法,在数据挖掘方面的应用越来越被人们所重视。利用粗糙集理论进行数据挖掘,得到知识规则,最重要的一点就是基于粗糙集的属性约简。文中在区分矩阵的基础上,改进了计算信息系统属性约简的方法,使属性约简计算量大幅度减小,可以快速得到给定要求下的属性约简。  相似文献   

6.
基于粗糙集的决策规则约简   总被引:4,自引:1,他引:4  
粗糙集理论是一个新的数据挖掘方法,正越来越被人们所重视。其主要思想是保持分类能力不变的情况下,利用等价类,通过属性约简和决策规则约简,达到发掘知识并简化知识的目的。但是属性约简是一个NP问题,对属性的约简和决策规则的约简只能通过启发式算法实现。该文针对属性约简和决策规则约简,各提出了一个启发式算法。  相似文献   

7.
基于粗糙集理论的属性约简算法的VB实现   总被引:1,自引:0,他引:1  
粗糙集理论成为近年来数据挖掘领域的研究热点,基于粗糙集理论的属性约简算法具有重要的研究意义,开发一套用于研究粗糙集理论属性约简算法的软件将是有效的辅助工具。论文首先对粗糙集理论基本概念及属性约简问题进行介绍,接着介绍该软件的设计和结构功能,举例说明该软件的应用,并提出该软件有待进一步扩展的功能。  相似文献   

8.
属性约简是应用粗糙集理论进行数据挖掘有效的方法之一,HORAFA属性约简算法它的不足之处在于约简效率和完备性.应用粗糙集对知识分类的特点,建立了新的数据挖掘模型.在模型的属性约简模块中,详细分析了HORAFA算法,提出了对其改进的HORAFA-AFVDM算法.该算法是在核中依次加入属性重要性最大的属性a,对于Red=Red è{a},当POSred-ai(D)=POSC(D)时删除a,直到不能再删为止,保证了算法的完备性.实验在MATLAB环境下实现,算法的测试数据来源于UCI数据集,通过对改进前后两种算法的比较,证实了改进后算法从属性约简效率和算法运行时间上均比之前的算法有显著的提高,文中将该数据挖掘模型应用到短信数据挖掘系统中.  相似文献   

9.
连续值属性决策表中的可变精度粗糙集模型及属性约简   总被引:2,自引:0,他引:2  
属性约简是粗糙集理论研究的一个核心问题.为了有效地处理决策表中连续值属性约简,提出了连续值属性决策表中的可变精度粗糙集模型以及基于此模型的连续值属性约简算法.仿真实验结果表明,该算法可以对连续值属性进行约简,而且比经典粗糙集相关方法在处理连续值属性约简方面更有效.  相似文献   

10.
粗糙集和灰色理论在数据挖掘领域各有优点,它们最终目标都是为了发现知识.将粗糙集和灰色系统结合,研究了区间灰色信息系统在优势关系下的约简方法.在现实世界中,属性之间可能存在着一种属性序的关系,将这种属性序关系引入到基于优势关系的灰色信息系统中,给出了两种属性约简的算法:一种基于分辨矩阵的算法,另一种不基于分辨矩阵的算法.较好地适应了不完备信息系统和大数据集信息系统约简.最后通过实例对比,得出两种算法的约简结果是一致的,并分析了各自的适用范围.  相似文献   

11.
本文在对数据挖掘相关技术、关联规则挖掘算法进行深入研究的基础上,归纳总结了基于粗糙集理论的关联规则挖掘模型和属性约简算法,并将其应用于高校教师的成长中。  相似文献   

12.
粗糙集属性应急数据存在冗余特征,降低挖掘效率,提出基于信息熵的粗糙集属性应急数据去重挖掘算法.将粗糙集理论和信息熵相结合,离散化处理应急数据,离散化完成后,约简对于决策表的条件信息熵大小不产生任何影响的属性,设定决策属性集合和条件属性集合,选取将同约简属性集合B的属性组合数目最小的熵值实现约简,去除冗余特征,完成应急数据去重挖掘.以大型船舶应急数据为研究对象展开数据去重挖掘,结果表明:可有效去重挖掘到船舶旋回性相关应急数据,利用数据增比特征能够分析到各因素对船舶旋回性的影响,并且所研究算法的挖掘效率较高,在数据量为1400条时,耗时仅为0.33 s.  相似文献   

13.
关联规则挖掘是数据挖掘的重要领域之一,利用粗糙集理论来挖掘关联规则的方法已经得到广泛关注.针对不完备信息系统,提出了基于粗糙集理论的快速ORD关联规则挖掘算法.该算法首先采用基于粗糙集理论的属性约简算法进行属性约简,然后采用快速、高效的冗余项集和冗余规则修剪算法--ORD算法获取关联规则.将该算法与其它同类流行的算法在4个UCI数据集上进行实验比较,结果表明该算法性能良好.  相似文献   

14.
核属性蚁群算法的规则获取   总被引:1,自引:0,他引:1  
蚁群算法是一种新型的模拟进化算法,研究已经表明该算法具有许多优良的性质,并且在优化计算中已得到了很多应用.粗糙集理论作为一种智能数据分析和数据挖掘的新的数学工具,其主要优点在于它不需要任何关于被处理数据的先验或额外知识.本文从规则获取和优化两方面研究基于粗糙集理论和蚁群算法的分类规则挖掘方法.通过研究决策表和决策规则系数,建立基于粗糙集表示和度量的知识理论,将粗糙集理论与蚁群算法融合,采用粗糙集理论进行属性约简,利用蚁群算法获取最优分类规则,优势互补.实验结果比较表明,算法获取的分类规则,具有良好的预测能力和更为简洁的表示形式.  相似文献   

15.
属性约简是粗糙集理论研究中的重要内容之一,现已证明寻找信息系统的最小约简是NP-hard问题。本文参考普通的增量式数据挖掘算法,提出一种改进的增量式属性约简算法,该算法在执行效率上比其他属性约简算法有了很大的提高,最后通过实例分析验证了算法的可行性和有效性。  相似文献   

16.
郭宁  林和  谭婧 《微机发展》2011,(2):98-101
粗糙集和灰色理论在数据挖掘领域各有优点,它们最终目标都是为了发现知识。将粗糙集和灰色系统结合,研究了区间灰色信息系统在优势关系下的约简方法。在现实世界中,属性之间可能存在着一种属性序的关系,将这种属性序关系引入到基于优势关系的灰色信息系统中,给出了两种属性约简的算法:一种基于分辨矩阵的算法,另一种不基于分辨矩阵的算法。较好地适应了不完备信息系统和大数据集信息系统约简。最后通过实例对比,得出两种算法的约简结果是一致的,并分析了各自的适用范围。  相似文献   

17.
概念格属性约简的启发式算法   总被引:4,自引:2,他引:2       下载免费PDF全文
概念格是知识处理与分析的一个有力的工具,在知识约简和数据挖掘方面有着重要的应用。该文首先从概念外延的角度研究了合理刻画属性重要性的指标,并给出了概念格属性约简的判定定理,然后以这些指标作为启发式信息设计了一种新颖的概念格启发式属性约简算法,最后通过实例表明了该约简算法的可行性与有效性。  相似文献   

18.
属性约简是粗糙集理论中重要的研究内容之一,是数据挖掘中知识获取的关键步骤。Pawlak粗糙集约简的对象一般是有标记的决策表或者是无标记的信息表。而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据。为此,结合半监督协同学习理论,提出了处理半监督数据的属性约简算法。该算法首先在有标记数据上构造两个差异性较大的约简来构造基分类器;然后在无标记数据上交互协同学习,扩大有标记数据集,获得质量更好的约简,构造性能更好的分类器,该过程迭代进行,从而实现利用无标记数据提高有标记数据的约简质量,最终获得质量较好的属性约简。UCI数据集上的实验分析表明,该算法是有效且可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号