首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
通过分析 Apriori 核心算法,使用案例描述 Apriori 算法设计思想上所存在的不足,引入兴趣度阈值对 Apriori 关联规则进行了改进. 并将该改进后的算法对电子病历数据库中数据进行关联规则提取,建立了基于兴趣度的 Apriori 算法的医疗诊断模型. 通过实验证明,该模型能够提取具有诊断价值的关联规则并提高医生的诊断效率.  相似文献   

2.
通过分析Apriori核心算法,使用案例描述Apriori算法设计思想上所存在的不足,引入兴趣度阈值对Apriori关联规则进行了改进.并将该改进后的算法对电子病历数据库中数据进行关联规则提取,建立了基于兴趣度的Apriori算法的医疗诊断模型.通过实验证明,该模型能够提取具有诊断价值的关联规则并提高医生的诊断效率.  相似文献   

3.
基于Apriori数据挖掘算法研究   总被引:3,自引:0,他引:3  
关联规则是从数据集中识别出频繁出现的属性值集,然后利用这些频繁集创建描述关联关系的规则过程.在分析经典关联规则挖掘算法的基础上,讨论了经典的Apriori算法,并提出改进的Apriori关联规则算法,对算法进行了实验数据的算法性能分析及运行时间对比.结果表明,改进的算法在运行速度和挖掘性能上都较经典的Apriori算法都有显著提高.  相似文献   

4.
通过研究基于两阶段频集思想的Apriori算法,针对Apriori算法的性能瓶颈提出了改进的Apriori算法,利用改进的Apriori算法对乳腺疾病数据进行挖掘,使用SQLServer2005数据挖掘工具,主要建立肿瘤复发和其他属性间的关联规则.挖掘结果证明了关联规则算法在医疗数据挖掘中的有效性.  相似文献   

5.
提出了一种基于MapReduce模型,利用向量矩阵和Apriori算法实现关联规则数据挖掘的新算法.算法利用MapReduce模型处理向量矩阵,结合Apriori算法思想,产生局部频繁项集,通过合并处理得到全局频繁项集.实验证明算法能提高关联规则挖掘的效率.  相似文献   

6.
文章用Java语言实现了关联规则挖掘的两个算法FP-growth和Apriori算法,将这两个算法应用于用XML表示的实验数据中,实现了从XML数据库中直接挖掘关联规则,并与基于XQuery实现的Apriori算法进行了性能比较。  相似文献   

7.
在关联规划挖掘理论研究上,首次给出了项目序列集格空间,并且探讨了在这个空间上的基本操作算子、基于项目序列集格空间及其操作,建立了关联规则挖掘模型.在关联规则挖掘算法方面,设计了基于项目序列集操作理论的关联规则挖掘算法SIS,该算法执行时间整体上优于Apriori算法,而且随着数据量的增大,该算法执行时间的增长幅度也小于Apriori算法.  相似文献   

8.
基于事务相似矩阵的关联规则挖掘算法   总被引:3,自引:0,他引:3  
通过对Apriori算法挖掘过程的深入分析,提出一种改进的关联规则挖掘算法——基于事务相似矩阵的关联规则挖掘算法(ARBSM):在压缩事务布尔矩阵的基础上构建一个事务相似矩阵,直接查找高阶肛项频繁集,有效解决了Apriori算法逐层搜索的迭代产生频繁项集的瓶颈问题。测试结果表明,ARBSM算法可以高效地挖掘潜在的强关联规则。  相似文献   

9.
对关联规则的Apriori算法的思想和性能进行了分析,提出了一种基于超级哈希树的关联规则挖掘算法,该算法只需扫描三次数据库,即可找出所有的频繁项目集,在每项事务的项目数不是太多的情况下,算法效率较Apriori有较大的改进。  相似文献   

10.
分类和关联规则是数据挖掘领域中最流行的两种技术。文章在分析Apriori关联规则算法的原理的基础上,对分类与Apriori两种技术的不同特点进行了比较。根据不同点将Apriori算法作为核心技术引入到分类挖掘中,给出一个新的分类算法,从实例的结果可以知道该算法的正确性和有效性,尤其是它能够很容易的处理带有缺省属性值的记录。  相似文献   

11.
在舆论分析系统中,高效、准确地获取敏感词一直是研究的热点。由于Apriori算法能较好地挖掘出事务之间的关系,并能快速找出新的敏感词,所以探索改进的Apriori算法显的更为重要。本文分析了经典Apriori算法的不足,提出了改进的Apriori算法,优化了程序执行的效率。实验结果表明:改进后的Apriori算法的执行效率比经典Apriori算法的执行效率要高。  相似文献   

12.
基于图的Apriori改进算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则挖掘中的经典算法,算法的核心思想是一种基于频繁理论的自底向上的递推方法。文中对Apriori算法进行分析,发现其中存在的问题。对Apriori算法做了改进。改进后的算法基于自顶向下的思想。利用有向图给出计算候选项集和项集支持度计数的更快的方法,同时简  相似文献   

13.
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出改进Apriori算法。该算法通过构造辅助表,减少访问表中的无效记录,从而减少每次访问数据库的次数,较好地提高了效率。实验结果表明,改进后的算法具有较好的有效性。  相似文献   

14.
基于关联规则的Web日志挖掘算法   总被引:1,自引:0,他引:1  
分析了经典的基于关联规则的Apriori挖掘算法,对该算法在Web日志挖掘中存在的不足进行了讨论。针对这些不足,对该算法进行了改进,并介绍了算法的具体实现。经实验测试,改进后的算法具有更好的效率。  相似文献   

15.
基于MapReduce的频繁项集挖掘方法   总被引:2,自引:0,他引:2  
为了改进关联规则挖掘的经典Apriori算法,设计一种基于Map/Reduce的频繁项集挖掘方法。通过搭建Hadoop平台,可使该方法得以实现,并籍此对该方法与Apriori算法的性能进行比较研究。实验结果表明该方法在对大数据集进行频繁项集挖掘时,可充分利用云计算的优势,从而能获得更好的时效性。  相似文献   

16.
Apriori算法的改进   总被引:2,自引:0,他引:2  
针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率.  相似文献   

17.
数据包应用层固定位置频繁出现的字节组合是识别应用层协议的一种重要的签名特征(signature)。数据挖掘中经典的Apriori算法在提取协议签名特征时具有准确性高、覆盖面广等优势,但同时也存在候选集规模大、重复扫描数据库等问题。在运用深度包检测技术的基础上改进Apriori算法,有效降低计算复杂度,并能够自动发现一种由确定的字节值和字符类型组合而成的协议签名特征。实验表明,文章的方法产生的签名特征具有准确的协议区分能力,并且在协议版本更新情况下的适应能力强,同时具有较好的未知协议特征发现能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号