首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
发现关联规则是知识发现的有效方法之一,现有的关联规则挖掘算法,对于存在数据属性相悖时,往往会挖掘出一些无法理解的关联规则。该文针对学生素质综合评估,提出一种基于属性相悖集的过程和优先序列方法,成功地判定和消除了相悖属性,从而使所挖掘出的关联规则成为有明确语义的知识。  相似文献   

2.
Rough集方法是一种处理不确定或模糊知识的重要工具。论文在现有的基于Rough集理论的缺省规则挖掘算法的基础上,将单属性信息增益概念扩充为多属性的情况,提出了基于信息增益的缺省规则的搜索策略和挖掘方法。实验表明,该方法能够发现简洁、易理解和实用的规则,同时具有较低的计算复杂性。  相似文献   

3.
最小冗余的无损关联规则集表述   总被引:1,自引:0,他引:1  
陈茵  闪四清  刘鲁  李岩 《自动化学报》2008,34(12):1490-1496
传统关联规则挖掘得到的原始规则集包含大量的、杂乱的规则, 其中很多是冗余的, 这样的规则集难以被用户理解和应用. 针对这一问题, 探讨了原始规则集与规则集表述之间的关系, 提出了一个新的规则集表述模型. 该模型包含一个利用概率统计原理构建的推演系统, 能够从原始规则集中去除冗余规则, 得到无损的规则集表述. 这种规则集表述比原始规则集更简洁、更易于理解以及更便于用户管理和应用. 更重要的是, 该模型得到的规则集表述是无损的, 能够实现原始规则集和规则集表述之间的相互推演, 保证了信息的完整性. 在四个著名数据集上进行的实验表明, 规则集表述中的规则数量显著减少.  相似文献   

4.
利用数据库技术实现的可扩展的分类算法   总被引:9,自引:0,他引:9  
刘红岩  陆宏钧  陈剑 《软件学报》2002,13(6):1075-1081
重点研究将数据挖掘中的分类技术与数据库技术紧密结合的高效的可扩展的分类算法.提出一种基于分组记数技术构造分类器的方法,利用数据库系统的结构化查询语言来实现主要计算任务.为了提高算法的执行效率,还提出了优化策略和冗余规则的剪裁策略,并将分类规则的发现过程与相关属性的选择方法有机地结合在一起.使用这些方法和策略,分类算法能够从大规模数据集中快速地发现一组简洁的规则.除了具有与现有分类算法相当的准确度和较高的执行效率以外,该分类算法还具有良好的基于训练集元组个数和属性个数两方面的可扩展性和易于实现的特点.  相似文献   

5.
一种基于粗集理论的分类规则挖掘的实现方法   总被引:8,自引:0,他引:8  
研究各种高性能和高可扩展性的分类算法是数据挖掘面临的主要问题之一。基于粗集理论的分类规则挖掘是一种重要的方法,在分析有关算法的基础上提出一种改进方法,并通过实例证明了该方法的效率有所提高。此外,还提出了一种分类规则约简方法,使挖掘的结果更简洁、更易理解。  相似文献   

6.
随着知识发现和数据挖掘的迅速发展,化工生产过程中,数据挖掘的应用日趋广泛.介绍了粗糙集的基本概念,决策系统的约简方法和分类规则的抽取,提出了基于信息熵的连续属性离散方法.并以三唑磷化合成工生产过程中的实际样本数据为例,采取粗糙集方法,从样本数据中挖掘出简明直接,易于理解的分类规则,实验结果表明,算法有效,结果令人满意.  相似文献   

7.
关联规则的提取是知识发现和数据挖掘领域中的重要问题,粗集理论是研究规则挖掘的重要的数学工具.本文研究信息系统中最优简单关联规则挖掘算法.本文利用信息关联矩阵中元素特性,对其进行变换,直接从中发现关联规则潜在的条件元,以此作为规则挖掘算法的基础.本文的算法简单直观,能挖掘出信息系统中所有最优简单规则,而且有效地避免了通常属性约简过程中的NP-hard问题.本文以一个实例证明本方法的有效性.  相似文献   

8.
王燕  李明 《计算机应用》2007,27(10):2376-2378
概念格是进行数据挖掘和规则提取的有力工具,通过分析概念格中概念的特征,提出了扩展概念格以及基于扩展概念格的分类规则获取算法。实验表明该算法能够生成简洁并且易于理解的规则集。  相似文献   

9.
赵雷  朱文兴 《计算机工程》2006,32(23):211-213
提出了一种分类规则易于理解性的新的定义,并给出了应用属性信息增益计算分类规则可理解性的方法。分析了遗传算法发现分类规则的过程。乳腺癌统计数据上的实验表明,它可以发现准确和易于理解的分类规则。  相似文献   

10.
针对贴片机的数据挖掘课题中,关联规则生成规则数较多而不易于分析的问题,研究了单决策属性作为规则后件的方法,对实际应用中存在条件约束的情况进行了分析,提出了基于决策属性的关联规则挖掘优化算法。应用结果表明这样得到的规则简洁明确,规则具有实用价值,并且频繁集优化的效果显著,达到了快速挖掘的目的。  相似文献   

11.
一种基于粗集理论的遗传分类算法   总被引:1,自引:0,他引:1  
姚前  陈舜  谢立  张军 《计算机科学》2008,35(1):198-201
本文提出了一种基于粗集理论的遗传分类算法,该算法可以无需任何辅助信息,只根据数据自身提供的信息对数据进行简化,提取有用的特征,并求得相应的规则.同时,还提出了一种基于属性重要度的分辨矩阵简化方法,该方法可提高对条件属性的约简效率.  相似文献   

12.
将Rough集理论应用于规则归纳系统,提出了一种基于粗糙集获取规则知识库的增量式学习方法,能够有效处理决策表中不一致情形,采用启发式算法获取决策表的最简规则,当新对象加入时在原有规则集基础上进行规则知识库的增量式更新,避免了为更新规则而重新运行规获取算法。并用UCI中多个数据集从规则集的规则数目、数据浓缩率、预测能力等指标对该算法进行了测试。实验表明了该算法的有效性。  相似文献   

13.
一种基于粗糙-模糊集理论的分类规则挖掘方法   总被引:1,自引:0,他引:1  
提出了一种基于粗糙-模糊集理论的分类规则挖掘方法,以解决信息不完整情况下的推理和决策问题,并给出了该方法的流程图。利用基于粗糙集的特征属性约简算法和基于模糊集的决策规则归纳方法,可以挖掘出样本中隐藏的关联规则,形成决策。最后,将其应用于一个具体的信息系统中,结果令人满意,证明该方法是可行的且是有效的。  相似文献   

14.
文中基于chi-square检验、有趣度及信息增益理论,给出了一种挖掘优化关联规则的算法。该算法将冗余的规则分为两个部分:一部分规则缺乏统计的相关性,而另外一部分规则不满足“新奇的”要求。实验结果表明算法可以有效地去除冗余规则并提高挖掘效率。  相似文献   

15.
从数据库中挖掘有用信息,将难理解的纯数据变为容易利用的规则,从而为以后的决策提供依据。以粗糙集理论和规则提取算法为基础,将基于信息量的粗糙集属性约简算法和规则提取算法集成起来提出一种集成算法,应用粗糙集约简掉冗余属性,然后利用规则提取算法得出有效规则。将此集成算法应用于农业领域,得出规则,并且效果良好,理论分析和应用都表明了本算法的有效性和实用性。此集成算法可以应用于各种大型数据库中,从中得出有效规则,让历史数据为以后的决策服务。  相似文献   

16.
针对面向属性的归纳方法及粗糙集方法对知识粒性连续性的特点,将两者有机结合,利用面向属性归纳方法对数据进行泛化,再用属性的信息增益技术寻找泛化属性之间的数据依赖关系,能快速地在数据集中挖掘分类规则。将其应用于经典的仿真算例中,仿真结果合理、可靠。  相似文献   

17.
粗糙集理论的主要思想是在保持信息系统分类能力不变的前提下,通过知识约简,导出问题的决策和分类规则:本文提出一种基于信息量的属性约简和规则提取的集成算法,并结合汽车里程试验数据进行验证,通过仿真实验,表明了该算法的有效性和可行性。  相似文献   

18.
基于贝叶斯粗糙集,引入全局增益,以此给出了贝叶斯粗糙集属性约简的另外一种算法,最后提出了一种基于颜色特征的图像分类模型及其分类算法。用该方法进行图像资源的分类,克服了经典粗糙集不宜处理带有噪声的数据和决策表不协调的分类问题的缺陷,同时又大大简化分类规则,且形成的规则集便于用户理解。  相似文献   

19.
丁春荣  李龙澍 《微机发展》2007,17(11):110-113
决策树是数据挖掘任务中分类的常用方法。在构造决策树的过程中,分离属性的选择标准直接影响到分类的效果,传统的决策树算法往往是基于信息论度量的。基于粗糙集的理论提出了一种基于属性重要度和依赖度为属性选择标准的决策树规则提取算法。使用该算法,能提取出明确的分类规则,比传统的ID3算法结构简单,并且能提高分类效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号