共查询到18条相似文献,搜索用时 62 毫秒
1.
基于增量式遗传算法的分类规则挖掘 总被引:11,自引:1,他引:11
分类知识发现是数据挖掘的一项重要任务,目前研究各种高性能和高可扩展性的分类算法是数据挖掘面临的主要问题之一。将遗传算法与分类规则挖掘问题相结合,提出了一种基于遗传算法的增量式的分类规则挖掘方法,并通过实例证明了该方法的有效性。此外,还提出了一种分类规则约简方法,使挖掘的结果更简洁、更易理解。 相似文献
2.
3.
4.
应用遗传算法构建化学模式分类器 总被引:2,自引:1,他引:1
神经网络和统计分析所构建的分类器均为复杂算式,难以体现专业知识;而分类规则直接以属性值为条件,确定个体类别,易于专业分析。对于连续属性的样本数据,本文应用基于信息熵的Chi-merge方法将其离散化,并将提取最优规则转换为组合优化问题,进而采用遗传算法求解。为此,本文将规则提取演绎为种群进化,并设计了个体适应度函数。由此提取出最优的分类规则,经过修剪处理后,与判别准则一起构成模式分类器。本文将其应用于橄榄油产地判别,所建立的分类器简单明了,规则数少,性能良好,适用于化学模式分类。 相似文献
5.
数据挖掘是在数据中发现隐藏的结构和模式。但发现的许多模式对用卢来说可能是已知的,从而使这些模式毫无意义,毫无兴趣性。文献中多强调分类规则的准确性和可理解性,但发现兴趣规则在数据挖掘算法中依然是一个令人生畏的挑战。本文采用一种遗传数据挖掘方法,在分类规则产生的同时对其兴趣性进行度量,直接产生兴趣规则。实验表明该方法是可行的、高效的。 相似文献
6.
7.
基于分类规则树的频繁模式文本分类 总被引:14,自引:0,他引:14
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出现与否,从而忽视了出现频度;另一方面,当产生的规则数量较多时,为提高分类效率需要进行规则修剪,修剪后的分类准确性明显降低.为此,提出了基于分类规则树的带词频的频繁模式文本分类方法.研究结果表明,词频的引入可以提高关联分类的准确率;而采用分类规则树可使分类时间明显加快又确保不降低分类质量.这两方面的措施弥补了现有关联分类应用于文本分类的不足.与3种典型文本分类方法比较后发现,在低维特征空间中,关联分类的性能优于Bayes,kNN(k nearest neighbor)和SVM(support vectormachines),因此是一种很有应用前景的文本分类方法. 相似文献
8.
9.
一种基于遗传算法的关联规则挖掘方法 总被引:3,自引:0,他引:3
彭建 《计算技术与自动化》2005,24(2):75-77
根据关联规则挖掘的要求与特点,结合遗传算法的思想,提出了一个基于遗传算法的关联规则挖掘方法,并通过实例分析,说明是一种具有实用价值的方法。 相似文献
10.
在数据挖掘的许多实际应用中,在进行准确分类(classification)的同时,按照分类的可能性大小进行排序(ranking)日益显得重要。许多分类算法在设计时只考虑分类的准确性,未考虑对分类的可能性进行度量,因而无法用于排序(ranking)任务。本文提出了一种新的基于遗传算法的数据挖掘方法,在产生分类规则的同时,对分类的可能性进行度量。实验证明该算法是可行的。 相似文献
11.
基于类频繁模式树的关联分类 总被引:1,自引:0,他引:1
提出一种新的基于类频繁模式树的关联分类算法CFPC(Class FP-tree based Classifier).该方法基于FP-tree实现,无需生成庞大的候选项目集;依据记录的分类属性进行指导性划分,并使用类支持度进行记录项的分类剪枝,生成类模式树,避免了小数据类别集上的强关联模式遗漏;挖掘出的规则形成分类器,用于类标号未知的记录的区分.试验结果表明CFPC的正确性和有效性. 相似文献
12.
13.
本文在以往研究工作的基础上,对遗传分类算法进行了改进。算法在种群中引入家族概念,采用族间交叉算子对算法进行综合调控,对族内交叉操作进行微调,针对分类问题的特点采用相应的编码方式和适应度函数。实验结果表明了分类算法的有效性。 相似文献
14.
一、引言 分类分析是数据挖掘使用的主要分析方法之一.其目的是通过对训练样本的分析产生一组规则,再将这组规则用于预测未来的数据.它在很多领域都有着广泛的应用,如医疗诊断、性能预测、优化市场销售策略和各种专家系统等等. 相似文献
15.
16.
该文对关联规则挖掘进行了概述,阐明了遗传算法的概念。作者根据传统遗传算法在关联规则中应用的缺点,提出了其应用的改进,并通过C++实现。应用实例证明了这种改进具有实用价值。在最后还指出仍需作进一步改进的地方。 相似文献
17.
该文对关联规则挖掘进行了概述,阐明了遗传算法的概念。作者根据传统遗传算法在关联规则中应用的缺点,提出了其应用的改进,并通过C++实现。应用实例证明了这种改进具有实用价值。在最后还指出仍需作进一步改进的地方。 相似文献
18.
提出了一种分布多库环境下的全局库分类规则发现算法——FGCMAR。FGCMAR在各个站点采用CMAR算法分别生成频繁模式树,并在各个站点间传送条件模式基来形成全局条件频繁模式树,最终通过挖掘条件频繁模式树来得到全局分类规则。该算法能够有效的减小网络通信量,提高挖掘效率。理论分析和实验结果表明该算法是有效可行的。 相似文献