共查询到20条相似文献,搜索用时 62 毫秒
1.
对关联规则的数据挖掘和遗传算法进行了介绍,提出了一种采用遗传算法的关联规则提取方法,并以交通事故的原因分析为例,进行了关联规则挖掘. 相似文献
2.
基于改进遗传算法的多维关联规则挖掘方法及应用 总被引:1,自引:1,他引:1
对遗传算法进行改进,并应用于多维关联规则挖掘中.在该算法中提出了一种基于免疫机制的新选择策略,并引入随机数,采用自适应方法随机动态选取交叉和变异概率.这种新算法不仅有效地抑制了早熟收敛现象,而且大大提高了搜索效率. 相似文献
3.
对关联规则的数据挖掘和遗传算法进行了介绍,提出了一种采用遗传算法的关联规则提取方法,并以交通事故的原因分析为例,进行了关联规则挖掘. 相似文献
4.
遗传算法在关联规则挖掘中的应用研究 总被引:1,自引:0,他引:1
在关联规则中引入遗传算法,并以地区生产总值统计为例尝试用遗传算法挖掘关联规则,阐述了遗传算法、数据挖掘及关联规则的概念和原理,并提出双层循环结构,利用精英重组,一致变异以及自适应参数的手段调整遗传算法进行数据挖掘,最后分析了该过程的收敛特性和时间复杂度. 相似文献
5.
由于频繁集的求解是关联规则发现的瓶颈,因此提出利用遗传算法来求固定项数的频繁集.根据该问题的特点,采用均匀设计方法产生初始种群,同时对交叉率和变异率进行了调整.利用随机产生的2 000条记录对算法进行了试验,证明了算法的有效性. 相似文献
6.
基于遗传算法主要集中应用在数据挖掘分类系统方面的特点,提出了一种改进的遗传算法以对关联规则进行挖掘,并对遗传算法的5个要素在使用过程中进行了相应的分析选择、设计和改进,最后将其应用到农业气象数据库的灾害分析中。试验结果表明了该方法具有一定的有效性。 相似文献
7.
用模糊遗传算法挖掘空间关联规则 总被引:2,自引:0,他引:2
空间关联规则是空间数据挖掘的重要知识内容,利用模糊遗传算法能很好地解决随机和非线性等问题的特征,解决空间关联规则的数据挖掘问题将离散化交叉概率pc和变异概率pm的模糊遗传算法应用到空间数据库空间关联规则的数据挖掘中,讨论模糊遗传算法的编码方法和适应度函数的构造,并给出了空间关联规则挖掘流程。研究结果表明,用模糊遗传算法挖掘空间关联规则的方法是可行的,并具有更高的挖掘效率。 相似文献
8.
王玉珍 《北京电子科技学院学报》2005,13(2):41-43
关联规则挖掘方法是Web挖掘的主要方法之一,本文在讨论了关联规则挖掘方法的一般知识后,重点研究了基于Web的兴趣关联规则挖掘技术.通过该技术可挖掘出访问者的兴趣爱好等信息,帮助网站经营者调整经营策略,提高网站的访问效率. 相似文献
9.
数值型关联规则挖掘是最优化问题而不是简单的离散问题,在大型数据库中挖掘数值型属性的关联规则具有一定的难度。为解决该问题,提出一种基于改进遗传算法的数据挖掘方法。针对数值型属性和布尔型属性的混合数据,设计一种分类并分界的编码方法;适应度函数采取范围收缩的策略,使属性边界向更精确的方向逼近;在此基础上设计出相应的交叉和变异算法,避免遗传算法的局部收敛和早熟问题;最后通过实例检验该算法的可行性。 相似文献
10.
基于概念层次的关联规则挖掘算法 总被引:4,自引:0,他引:4
杨学兵 《安徽工业大学学报》2003,20(4):318-321
在经典关联规则挖掘算法的基础上,给出了带有概念层次的事务数据的关联规则有效挖掘算法,并通过实验,给出算法执行效率的分析。结果表明,该算法能得到有效的基于概念层次的关联规则。 相似文献
11.
一个改进项目的加权关联规则挖掘算法 总被引:1,自引:0,他引:1
刘燕 《昆明理工大学学报(自然科学版)》2008,33(4)
提出了一个改进的项目加权关联规则挖掘算法.该算法利用一个加权频繁项目集必须满足的加权支持度下界,对加权频繁候选项目集进行剪枝,该下界计算简便,可以减少挖掘的计算量.理论分析和实验表明本算法和MINWAL(W)相比,具有生成候选集数量少、挖掘效率高等特点,特别在项目权值相差不大时,本算法的优势更明显. 相似文献
12.
为避免信息超载而在过多的无用信息中迷失方向,信息检索的重要性日益提高。文本自动分类是信息检索中最重要的工具之一。提出了一个用于中文文本自动分类的、称为关联规则辅助的遗传计算方法(AssociationRulesAidedGeneticComputingMethod,缩写为ARGCM)。提出并实现了文本分类的关联规则辅助的遗传算法;不同于前人的路线,适应度函数的编码借助了关联规则,而关联规则通过此文提出的ARGACM算法挖掘;实现了并测试了一系列基础遗传过程,例如AGACMRouletteSelection过程,AGACMXover过程和AGACMbinaryMutatio过程;实验结果表明新的ARG算法性能远优于传统的算法,其中向量AB Vector经过50代ARG算法的进化后,获得了高达3513.6的评分。 相似文献
13.
关联规则挖掘主要用于发现隐藏在数据中的知识。加权关联规则挖掘能更有效地挖掘出项目重要性不同的规则。针对人工赋权的方法存在一定的主观随意性,没有充分利用数据本身特征且串行算法无法处理大数据集的问题。提出了独立概率完全加权关联规则的并行挖掘算法,该算法以项在当前数据集中出现概率为依据进行完全加权模型构建,以挖掘出更多用户所期待的关联规则。采用前缀划分、位图存储等技术分别解决加权频繁项集筛选、候选加权频繁项集生成所造成时间代价高的问题。引入分布式并行计算思想,并在Spark框架下编程实现,使算法可以在大数据环境下对加权关联规则进行高效挖掘。利用数值实例对该模型和算法进行了验证,结果表明此算法可在保证算法时间效率优越的同时获得更多隐藏信息。 相似文献
14.
15.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。 相似文献
16.
软集是一种新的处理不确定性问题的数学工具。基于软集和逻辑公式,提出一种新的关联规则挖掘方法。将软真度引入软集数据关联规则挖掘,利用软真度描述属性集之间的量化关系;讨论软真度和支持度之间的联系,给出满足给定的支持度阈值和可信度阈值的软关联规则挖掘方法。实例分析结果表明,该方法可约简冗余,提高效率。 相似文献
17.
基于集体度-置信度的关联规则挖掘 总被引:2,自引:0,他引:2
总结并研究了基于集体度-置信度的关联规则挖掘算法,用集体度代替支持度对搜索空间进行压缩,成功地解决了传统的频繁关联规则挖掘存在的属性集产生上的欺骗性及处理稠密数据集方面的缺陷. 相似文献
18.
针对初始种群对遗传算法求解作业车间调度结果影响较大的问题,提出基于关联规则的作业车间调度问题改进遗传算法(association rules improvement genetic algorithm,AR-GA),以提升算法性能。首先,在遗传算法种群初始化阶段借助关联规则获取基因序列中的频繁工序块;其次,在交叉阶段根据频繁工序块在待交叉种群的分布中设计3种交叉方式;最后,在变异过程中结合分段海明距离引导子代种群变异,并且在每次迭代后更新频繁工序块信息。标准案例测试结果表明,改进后的算法在求解作业车间调度问题时求解效率更高,稳定性更好。 相似文献
19.
模糊关联规则挖掘及其算法研究 总被引:7,自引:0,他引:7
针对数据挖掘中的“尖锐边界”问题,阐述了模糊关联规则挖掘技术,提出了在模糊关联规则的挖掘中将事务属性模糊集中的元素作为单一属性来处理的方法,给出了模糊关联规则挖掘的算法。最后以网络流量分析为例,描述了模糊关联规则挖掘的具体应用。 相似文献
20.
关联规则是数据挖掘研究的一个重要课题,而最大频繁项集的生成是影响关联规则挖掘的关键问题。在已有的频繁集发现算法中,DLG算法通过减少事务数据库的扫描次数,进而有效减少挖掘过程的I/O代价,在阐述DLG算法的实现原理与执行过程的基础上,为进一步减少候选项集的数量,提出一种改进算法DLG,其主要思想是在关联图构造阶段,统计每一个频繁项目的入度,以此作为剪枝的依据,性能分析和比较试验的结果表明该算法性能优良。 相似文献