首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
基于增量式遗传算法的分类规则挖掘   总被引:11,自引:1,他引:11  
分类知识发现是数据挖掘的一项重要任务,目前研究各种高性能和高可扩展性的分类算法是数据挖掘面临的主要问题之一。将遗传算法与分类规则挖掘问题相结合,提出了一种基于遗传算法的增量式的分类规则挖掘方法,并通过实例证明了该方法的有效性。此外,还提出了一种分类规则约简方法,使挖掘的结果更简洁、更易理解。  相似文献   

2.
针对云存储数据源分散、难于集中的特点,根据代理提取分类规则数与每个代理提取误差率以及整体提取误差率之间的关系,提出一种基于遗传算法的云存储分类规则提取方法.在代理端分布式提取分类规则后传输到中心数据库进行归并,从而达到分布式提取分类规则的目的,通过理论推导得出每个代理提取误差率和整体提取误差率的上限随着提取规则数的增加而递减.实验结果证明,在提取规则数足够多的情况下,分布式提取的回归准确率和集中式提取的回归准确率的差值趋于常数,保证了云存储分布式分类规则提取的可行性.  相似文献   

3.
一种基于小生境遗传算法的规则提取算法   总被引:2,自引:0,他引:2  
本文描述一种基于小生境遗传算法的规则提取算法,并从语言表述、规则编码、搜索 策略三个方面做了讨论和分析.相对于原有的一些方法,本算法拥有适应性好、收敛快速的 特点,所生成的规则简洁,易于理解.  相似文献   

4.
应用遗传算法构建化学模式分类器   总被引:2,自引:1,他引:1  
神经网络和统计分析所构建的分类器均为复杂算式,难以体现专业知识;而分类规则直接以属性值为条件,确定个体类别,易于专业分析。对于连续属性的样本数据,本文应用基于信息熵的Chi-merge方法将其离散化,并将提取最优规则转换为组合优化问题,进而采用遗传算法求解。为此,本文将规则提取演绎为种群进化,并设计了个体适应度函数。由此提取出最优的分类规则,经过修剪处理后,与判别准则一起构成模式分类器。本文将其应用于橄榄油产地判别,所建立的分类器简单明了,规则数少,性能良好,适用于化学模式分类。  相似文献   

5.
数据挖掘是在数据中发现隐藏的结构和模式。但发现的许多模式对用卢来说可能是已知的,从而使这些模式毫无意义,毫无兴趣性。文献中多强调分类规则的准确性和可理解性,但发现兴趣规则在数据挖掘算法中依然是一个令人生畏的挑战。本文采用一种遗传数据挖掘方法,在分类规则产生的同时对其兴趣性进行度量,直接产生兴趣规则。实验表明该方法是可行的、高效的。  相似文献   

6.
赵雷  朱文兴 《计算机工程》2006,32(23):211-213
提出了一种分类规则易于理解性的新的定义,并给出了应用属性信息增益计算分类规则可理解性的方法。分析了遗传算法发现分类规则的过程。乳腺癌统计数据上的实验表明,它可以发现准确和易于理解的分类规则。  相似文献   

7.
基于分类规则树的频繁模式文本分类   总被引:14,自引:0,他引:14  
陈晓云  陈袆  王雷  李荣陆  胡运发 《软件学报》2006,17(5):1017-1025
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出现与否,从而忽视了出现频度;另一方面,当产生的规则数量较多时,为提高分类效率需要进行规则修剪,修剪后的分类准确性明显降低.为此,提出了基于分类规则树的带词频的频繁模式文本分类方法.研究结果表明,词频的引入可以提高关联分类的准确率;而采用分类规则树可使分类时间明显加快又确保不降低分类质量.这两方面的措施弥补了现有关联分类应用于文本分类的不足.与3种典型文本分类方法比较后发现,在低维特征空间中,关联分类的性能优于Bayes,kNN(k nearest neighbor)和SVM(support vectormachines),因此是一种很有应用前景的文本分类方法.  相似文献   

8.
本文根据关联规则和分类规则的概念与表示形式,指出在关联规则挖掘过程中如果指定挖掘与一个确定的项相关联,那么就是分类规则挖掘了,论述了分类规则是特殊情况下的关联规则,并指出在这种特殊情况下,关联规则所具有的特征;然后根据这一论述,提出了一种在关联规则挖掘算法中利用限制条件概率分布来发现分类规则的算法。  相似文献   

9.
一种基于遗传算法的关联规则挖掘方法   总被引:3,自引:0,他引:3  
根据关联规则挖掘的要求与特点,结合遗传算法的思想,提出了一个基于遗传算法的关联规则挖掘方法,并通过实例分析,说明是一种具有实用价值的方法。  相似文献   

10.
在数据挖掘的许多实际应用中,在进行准确分类(classification)的同时,按照分类的可能性大小进行排序(ranking)日益显得重要。许多分类算法在设计时只考虑分类的准确性,未考虑对分类的可能性进行度量,因而无法用于排序(ranking)任务。本文提出了一种新的基于遗传算法的数据挖掘方法,在产生分类规则的同时,对分类的可能性进行度量。实验证明该算法是可行的。  相似文献   

11.
基于类频繁模式树的关联分类   总被引:1,自引:0,他引:1  
提出一种新的基于类频繁模式树的关联分类算法CFPC(Class FP-tree based Classifier).该方法基于FP-tree实现,无需生成庞大的候选项目集;依据记录的分类属性进行指导性划分,并使用类支持度进行记录项的分类剪枝,生成类模式树,避免了小数据类别集上的强关联模式遗漏;挖掘出的规则形成分类器,用于类标号未知的记录的区分.试验结果表明CFPC的正确性和有效性.  相似文献   

12.
一种基于GEP的分类规则挖掘算法   总被引:1,自引:0,他引:1       下载免费PDF全文
基于一种新的自动程序设计方法基因表达式程序设计(GEP),通过设计适应函数、初始化群体的优化、增加新的遗传算子以及采用演化策略中的(λ+μ)淘汰策略等对原始GEP算法进行有效的改进,设计出一种新的数据挖掘算法。采用UCI机器学习知识库中的数据集对该算法进行了实验,并通过与C4.5及文献[3]的比较,检验了该算法的准确性。  相似文献   

13.
本文在以往研究工作的基础上,对遗传分类算法进行了改进。算法在种群中引入家族概念,采用族间交叉算子对算法进行综合调控,对族内交叉操作进行微调,针对分类问题的特点采用相应的编码方式和适应度函数。实验结果表明了分类算法的有效性。  相似文献   

14.
一、引言 分类分析是数据挖掘使用的主要分析方法之一.其目的是通过对训练样本的分析产生一组规则,再将这组规则用于预测未来的数据.它在很多领域都有着广泛的应用,如医疗诊断、性能预测、优化市场销售策略和各种专家系统等等.  相似文献   

15.
大部分关联规则更新算法只考虑最小支持度这一因素,没有考虑最小置信度阈值,而在数据库更新时只考虑数据的添加,不考虑数据的删除。为此,提出一种可同时考虑上述问题的动态数据库更新算法,该算法可有效挖掘出人们感兴趣的知识,并能节省大量挖掘时间。实验结果表明,该算法是切实可行的。  相似文献   

16.
该文对关联规则挖掘进行了概述,阐明了遗传算法的概念。作者根据传统遗传算法在关联规则中应用的缺点,提出了其应用的改进,并通过C++实现。应用实例证明了这种改进具有实用价值。在最后还指出仍需作进一步改进的地方。  相似文献   

17.
该文对关联规则挖掘进行了概述,阐明了遗传算法的概念。作者根据传统遗传算法在关联规则中应用的缺点,提出了其应用的改进,并通过C++实现。应用实例证明了这种改进具有实用价值。在最后还指出仍需作进一步改进的地方。  相似文献   

18.
提出了一种分布多库环境下的全局库分类规则发现算法——FGCMAR。FGCMAR在各个站点采用CMAR算法分别生成频繁模式树,并在各个站点间传送条件模式基来形成全局条件频繁模式树,最终通过挖掘条件频繁模式树来得到全局分类规则。该算法能够有效的减小网络通信量,提高挖掘效率。理论分析和实验结果表明该算法是有效可行的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号