首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 60 毫秒
1.
一种Apriori的改进算法   总被引:3,自引:0,他引:3  
在对关联规则挖掘算法Apriori进行深入研究的基础上,提出了一种采用频繁项集Lk-1 与L1连接生成候选项集Ck的思想,并基于这种新的思想提出了一种优化的算法1-K_Apriori算法.在真实数据集和实验数据集上所做的实验及结果表明,1-K_Apriori算法是有效的.  相似文献   

2.
本研究在对Apriori算法分析的基础上,提出了改进的Apriori算法。改进后的算法采用矩阵表示数据库,减少了扫描事物数据库的次数;利用向量运算来实现频繁项集的计数,同时及时地去掉不必要的数据,减少了数据运算,从而提高了算法的运行效率。  相似文献   

3.
对Apriori算法加以改进,提出了一种更高效的关联规则挖掘算法,在扫描数据库的同时把支持每个项目的事务都标记出来,采用一种新的方法来计算候选项目集的支持度.该算法只需对源数据库进行一次扫描,就可以找出所有的频繁集,具有很高的效率.  相似文献   

4.
针对Apriori算法需要多次扫描数据库的缺陷,提出一种基于垂直事务关系的改进算法XApriori。该方法对原始事务数据库扫描后,采用项集事务垂直对应关系的位集合数据存储结构,并构建逻辑生成候选项集策略,利用数值统计的方法生成候选项集并确定频繁项集,实现关联规则的挖掘。对比实验结果表明,改进算法比Aprior算法关联规则挖掘的效率有所提高。  相似文献   

5.
Apriori算法是挖掘关联规则频繁项集的最有影响的算法之一,它通过连接、剪枝等步骤产生频繁项集,进而产生强关联规则。由于面临海量数据,因此将会产生大量的候选项集,尤其是候选2-项集,严重影响了挖掘的效率。提出了一种改进的算法,此算法不产生小项候选集而直接产生大项候选集,从而提高了算法的效率。  相似文献   

6.
针对Apriori算法在频繁项集挖掘过程中的缺陷,提出了一种基于权重的改进Apriori算法。该改进算法通过一次扫描事务数据库构造出二元事务矩阵,再用各事务和各项的平均权重替代权重支持度,最终挖掘出事务库中的频繁项集。通过实例分析和性能测试,证明了改进的Apriori算法避免了重复扫描事务数据库,使得算法在性能上有了明显优化,并且挖掘出了Apriori挖掘不到的、隐藏的、有价值的规则。  相似文献   

7.
针对Apriori算法需要频繁扫描事务数据库并且会产生大量候选项集的不足,提出一种改进的Apriori算法。采用矩阵压缩的思想,增加了3个向量,分别表示事务矩阵中各行各列1的个数,即事务项目数和项目支持数,以及重复的事务出现次数,从而减小矩阵规模,避免多次扫描数据库。在矩阵运算过程中,对矩阵中事务项目数和项目支持数进行排序并删除不满足条件的项集和非频繁项集,形成新的矩阵结构,提高空间效率。对改进后的算法进行性能分析和试验分析发现,该算法相对于Apriori算法具有更高的效率,同时可以更有效的挖掘出频繁项集。  相似文献   

8.
一种改进的关联规则挖掘算法   总被引:2,自引:0,他引:2  
本文在Aprioi算法的基础上,引入了临时数据库及多支持度,使交易数据库的规模不断缩小,同时又灵活控制了各频繁项集产生的数量,结果表明该算法对关联规则挖掘较为有效。  相似文献   

9.
Apriori算法的改进   总被引:2,自引:0,他引:2  
针对Apriori算法要多次扫描事务数据库以及生成大量候选集缺陷,在候选集C_1中增加事务标识符列表Tid_list实现只扫描一遍事务数据库,利用频繁项目集的性质来减少生成候选集的数量,提高了算法效率.  相似文献   

10.
Apriori算法分析与改进综述   总被引:5,自引:0,他引:5  
数据挖掘中的关联规则挖掘能够发现大量数据中项集之间有趣的关联或相关联系,特别是随着大量数据不停地收集和存储,从数据库中挖掘关联规则就越来越有其必要性.通过对关联规则挖掘技术及其相关算法Apriori进行分析,发现该技术存在的问题.本文介绍了能优化该技术的各种算法,分析了这些算法各自的优缺点,并针对这些问题提出了未来的研究方向.  相似文献   

11.
关联规则是数据挖掘中一个重要课题,通过对Apriori算法的分析,提出了基于向量的C++算法,降低了算法的实现难度,为进一步研究提供了方便,实验证明了算法的有效性。  相似文献   

12.
针对Apriori算法寻找频繁项集需要反复扫描数据库的问题,提出了一种将事务数据布尔化,并在其基础上通过优化连接和剪枝,快速查找频繁项集的思想。即通过优化连接和剪枝,减少候选项集,并根据判断相应布尔向量"与"运算的结果,快速地归纳出频繁项集。研究和实验表明,该算法不仅只需扫描一次数据库,而且还具有查找速度快,节省内存空间和处理项目集维数多等优点。  相似文献   

13.
在介绍关联规则基本原理的基础上,对Apriori算法进行了详细的分析和研究,并将Apri-0ri算法应用于消费市场价格数据中,挖掘出了各种农副产品价格之间的关联关系,即从大量的农副产品价格数据中挖掘出了大米、玉米、大麦和羊肉、牛肉价格之间的关联规律.  相似文献   

14.
以基于数据挖掘关联规则的Apriori算法基本原理为依据,介绍了高校人力资源数据挖掘系统主要功能模块的组成,着重研究了Apriori算法的设计与实现.该数据挖掘系统为高校人力资源决策提供了科学的依据,在高校人力资源管理应用中做出了有益的尝试.  相似文献   

15.
基于图的Apriori改进算法   总被引:3,自引:0,他引:3  
Apriori算法是关联规则挖掘中的经典算法,算法的核心思想是一种基于频繁理论的自底向上的递推方法。文中对Apriori算法进行分析,发现其中存在的问题。对Apriori算法做了改进。改进后的算法基于自顶向下的思想。利用有向图给出计算候选项集和项集支持度计数的更快的方法,同时简  相似文献   

16.
提出了一种易于改进的AprioriTid优化算法,它的特点是:一项频繁集和二项频繁集用经典Apriori算法实现,三项及其以上频繁集采用AprioriTid优化算法的思想,即项目集采用关键字识别来统计支持度.实验结果表明,算法易于实现,比AprioriTid优化算法有更好的性能.  相似文献   

17.
在语音合成系统中,韵律特征参数的描述正确与否直接影响着语音合成系统的输出效果。为了 解决目前语音合成技术中提高合成语音自然度这一难点,研究了数据挖掘技术来发现韵律参数之间的 相互关系。通过改进Apriori算法对这些关系进行规则描述,来解决目前语音合成中缺陷的前后音节的 韵律参数之间的关系。结果表明,经改进后适合语音数据的Apriori算法,可以获得汉语韵律参数中基频 参数和时长参数的变化规则,这些规则较方便的为语音合成系统的选音提供帮助和指导。  相似文献   

18.
在语音合成系统中,韵律特征参数的描述正确与否直接影响着语音合成系统的输出效果。为了解决目前语音合成技术中提高合成语音自然度这一难点,研究了数据挖掘技术来发现韵律参数之间的相互关系。通过改进Apriori算法对这些关系进行规则描述,来解决目前语音合成中缺陷的前后音节的韵律参数之间的关系。结果表明,经改进后适合语音数据的Apriori算法,可以获得汉语韵律参数中基频参数和时长参数的变化规则,这些规则较方便的为语音合成系统的选音提供帮助和指导。  相似文献   

19.
结合学生成绩数据的特点,将数据挖掘技术和关联规则算法运用到学生成绩数据分析中,挖掘隐藏在成绩数据背后的专业课程间的相互影响与关联关系,优化课程设置,为教学管理工作提供决策信息支持和参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号