首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性。最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的。  相似文献   

2.
针对负关联规则挖掘所带来的问题,提出加入最大支持度来控制频繁项集生成规模,改进了相关性的计算公式,并将其用作正负关联规则的兴趣度来剔除无兴趣的关联规则,限制关联规则中的前后件项目个数来保证挖掘出的关联规则的实用性和可理解性.最后,给出一种能够同时挖掘正负关联规则的算法,实验结果表明算法是有效的、可行的.  相似文献   

3.
关联规则是当前数据挖掘研究最重要的分支之一,目前的关联规则多是在频繁项集的基础上进行挖掘,而没有挖掘非频繁项集的算法。本文在多支持度算法的基础上,提出了一种新的算法模型,在挖掘频繁项集的同时还能够对非频繁项集进行挖掘。  相似文献   

4.
一种改进的关联规则挖掘算法   总被引:2,自引:0,他引:2  
本文在Aprioi算法的基础上,引入了临时数据库及多支持度,使交易数据库的规模不断缩小,同时又灵活控制了各频繁项集产生的数量,结果表明该算法对关联规则挖掘较为有效。  相似文献   

5.
最频繁项集挖掘决定了文本关联规则挖掘算法的性能,是文本关联规则挖掘中研究的重点和难点。该文分析了当前最频繁项集挖掘方面的不足,改进了传统的倒排表,结合最小支持度阈值动态调整策略,提出了一个新的基于改进的倒排表和集合理论的Top-N最频繁项集挖掘算法。同样,给出了几个命题和推论,并把它们用于该文算法以提高性能,实验结果表明,所提算法的规则有效率和时间性能优于NApriori算法和IntvMatrix算法。  相似文献   

6.
关联规则是数据挖掘研究的一个重要课题 ,而最大频繁项集的生成是影响关联规则挖掘的关键问题 .在已有的频繁集发现算法中 ,DLG算法通过减少事务数据库的扫描次数 ,进而有效减少挖掘过程的I/O代价 .在阐述DLG算法的实现原理与执行过程的基础上 ,为进一步减少候选项集的数量 ,提出一种改进算法DLG .其主要思想是在关联图构造阶段 ,统计每一个频繁项目的入度 ,以此作为剪枝的依据 .性能分析和比较试验的结果表明该算法性能优良  相似文献   

7.
关联规则挖掘是数据挖掘的一个重要研究方向。关联规则挖掘分为两个阶段:发现频繁项集和由频繁项集产生关联规则。介绍由频繁项集产生关联规则的算法设计,并用VC 6.0实现,程序运行能满足要求。  相似文献   

8.
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。  相似文献   

9.
由频繁项集产生的关联规则往往不能保证规则前、后件中的项是正相关的,因此可能产生无意义的关联规则;当这些关联规则用于分类时,会产生大量无用分类规则,增加了时间开销.因此,基于数学期望提出了正相关的频繁项集的分类算法.该算法在挖掘正相关频繁项集时,利用置信度进行规则选取,生成正相关关联规则组成的分类器对数据集进行分类.实验表明,这种分类算法可以大幅度减少所产生的频繁项集数量,分类准确率达到C4.5和CMAR的水平,且显著减少了算法的时间.  相似文献   

10.
关联规则是数据挖掘研究的一个重要课题,而最大频繁项集的生成是影响关联规则挖掘的关键问题。在已有的频繁集发现算法中,DLG算法通过减少事务数据库的扫描次数,进而有效减少挖掘过程的I/O代价,在阐述DLG算法的实现原理与执行过程的基础上,为进一步减少候选项集的数量,提出一种改进算法DLG,其主要思想是在关联图构造阶段,统计每一个频繁项目的入度,以此作为剪枝的依据,性能分析和比较试验的结果表明该算法性能优良。  相似文献   

11.
关联规则挖掘是数据挖掘的重要领域之一,目前多数监督学习算法对满足最小支持度和最小置信度的关联规则进行深入分析的较少。剖析了分类关联规则挖掘算法CAR-Apriori算法,并提出了一种基于多最小支持度和支持度差别限制的分类关联规则挖掘算法MSCAR-Apriori算法。实验结果表明,改进算法不仅可以挖掘出满足给定条件的分类关联规则,同时还可以保留稀有但用户感兴趣且可能蕴涵巨大利润的规则项。  相似文献   

12.
以前基于支持度一置信度框架的关联规则挖掘算法都是先用支持度做为阈值对搜索结果进行剪枝 ,产生频繁集 ,再针对频繁集产生关联规则 ,这就是频繁关联规则。然而在很多应用中 ,诸如 :鉴别相似的Web文件、网络中入侵检测等 ,有许多有趣的关联规则仅有很少的支持度。在本文中 ,针对这种情况 ,提出了一种可以挖掘非频繁项之间有趣规则的算法 ,此算法先用相似度作为兴趣度度量对算法结果进行剪枝  相似文献   

13.
通过分析Apriori核心算法,使用案例描述Apriori算法设计思想上所存在的不足,引入兴趣度阈值对Apriori关联规则进行了改进.并将该改进后的算法对电子病历数据库中数据进行关联规则提取,建立了基于兴趣度的Apriori算法的医疗诊断模型.通过实验证明,该模型能够提取具有诊断价值的关联规则并提高医生的诊断效率.  相似文献   

14.
基于双向关联规则项目评分预测的推荐算法研究   总被引:1,自引:1,他引:1  
针对用户评分数据稀疏性问题,通过对事务数据库项目空间关联性分析,提出基于双向关联规则项目评分预测的推荐算法。算法利用双向关联规则挖掘事务数据库中相互关联的项目,找到目标项目的关联集,利用已评分项目初步预测用户对目标项目的偏好程度,最后结合协同过滤算法为用户提供推荐服务。实验结果表明,当置信度水平在60%~90%之间变动,支持度在5%~10%之间变化时,关联规则数目随着置信度和支持度水平的增加而逐渐减少,而推荐精度逐步提高。为了验证算法的有效性,选取置信度为80%以及支持度为7%与传统的推荐算法比较,所设计的算法能够较精确地找到目标项目的关联集,推荐精度和效率明显优于传统的推荐算法。  相似文献   

15.
随着数据库规模的日益增大,关联规则挖掘需要在挖掘效率、可用性、隐私性及精确性等方面得到提升,需要对传统的关联规则挖掘算法进行更新和改进。在传统的Apriori算法基础上,提出了一种新的在关系数据库中挖掘关联规则的算法。该算法只需扫描一次数据库即可得到频繁项集,并通过非频繁项集来减少候选项集的生成,从而提高了算法的运算效率;此外,该算法将包含敏感数据事务做相关的处理,以达到隐藏包含敏感数据的关联规则。理论分析和实验结果表明,新算法不仅提高了关联规则挖掘的效率,而且还达到了隐藏包含敏感规则的目的。  相似文献   

16.
遗传算法编码设计及其在数据挖掘中的应用   总被引:1,自引:0,他引:1  
数据挖掘就是从大量的数据中提取或者“挖掘”知识,从而实现对数据资源的有效利用.关联分析是数据挖掘诸多功能中应用最广泛的一种.关联分析用于发现关联规则,关联规则描述了给定数据集的项之间的有趣联系.提出了一种基于遗传算法的关联规则的挖掘算法.在关联规则的编码方面,提出了对个体进行变长编码的方法,从而在一定程度上减少了无效规则的数目;在适应度函数的构造方面也进行了一些改进;针对规则库的覆盖问题,采用标志位的方法,对挖掘过的规则设置标志,避免规则重复挖掘.  相似文献   

17.
行为模式通常反映了人们的行为习惯和特征.该文针对在线学习系统,利用数据挖掘中的分类算法和关联规则算法,对学习者留下的行为项,进行模式挖掘.并提出了一种分类预测与关联检测相结合的身份验证方法,能有效鉴定学习者身份的真实性,最后给出相应的实验结果及分析.  相似文献   

18.
Apriori算法是挖掘布尔关联规则频繁项集的最有影响的数据挖掘算法之一,但由于数据挖掘本身决定其面临的是海量数据,因此在许多情况下会产生大量候选项集,从而严重影响挖掘的效率。本文提出一种简单有效的Apriori改进算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号