首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
王晓龙 《信息技术》2014,(5):147-150,153
关联规则现在已成为数据挖掘领域中非常重要的研究课题,用于发现隐藏在大型数据集中的令人感兴趣的联系。Apriori算法作为第一个关联规则挖掘算法,开创性地使用了基于支持度的剪枝技术,系统地控制了候选项集的指数增长。但是,Apriori算法仍然存在着频繁扫描数据库和产生大量候选项集的缺点。鉴于此,提出了用一个整型或整型数组来代替一项事务集和一项候选项集,通过数据压缩,可以一次性将海量数据载入内存,减少了磁盘I/O负载,并通过位运算与计算海明距离达到计算支持度的目的,同时使用了若干优化方法。  相似文献   

2.
文中提出了一种二元表示聚类方法。首先,将要研究的实体以属性串的方式表达,并通过二元树转化为二进制串。其次,采用改进的海明距离代替欧氏距离计算二进制串之间的相似度。该方法通过属性加权,使计算结果更加贴近现实,并将实体以‘01’编码方式表示,简化了计算,提升了运算效率。最后,选取1796家上市公司的73个财务指标进行实验,结果表明,该方法对海量数据的处理表现良好。  相似文献   

3.
黄玉蕾  罗晓霞  林青 《电信科学》2015,31(11):85-90
提出了一种改进的Apriori关联规则挖掘算法,称为Apriori-BR。该算法首先通过扫描两次数据库建立各个频繁项目集到事务的倒排索引,并对倒排索引按照事务长度进行分组,然后在挖掘过程中,利用位运算加快子集的检测,并在必要时动态删除无效的低维事务。实验结果表明,相比于经典的Apriori算法和已有文献中的改进算法,本文所提的Apriori-BR算法显著提高了挖掘效率。  相似文献   

4.
互联网作为一个国家教育事业的基础设施,是人们获取知识的一个重要途径。传统网络服务系统功能简单,服务单一,网络利用率不足。文章改进关联规则Apriori算法并应用于网络数据处理中,提高数据利用率。  相似文献   

5.
张宁 《信息通信》2015,(2):94-95
在经典的Apriori策略中,各次遍历操作均访问全部数据库。将FP-tree策略移植到Apriori中以重构数据库,提出了FP-A算法。通过对原数据库划分为一系列子数据库,并设置相应的频繁度计数,避免每次访问全部数据库记录,提高算法效率。实验结果表明,FP-A策略具有高效性。  相似文献   

6.
7.
关联规则挖掘是数据挖掘技术的一个重要分支,其中Apriori算法是最经典和最有影响力的算法。本文在讨论和分析了关联规则挖掘的基本概念后,提出了一种减少扫描数据库次数的改进算法。改进后的算法分析证明,它可以有效地提高数据挖掘的性能。  相似文献   

8.
针对关联规则中Apriori算法的不足之处,提出两种基于矩阵的Apriori改进算法.改进算法充分利用矩阵这一工具,以大幅度减少扫描数据库的次数和计算成本,进而有效提高算法的运算效率.同时,通过实例应用和算法性能分析证明所提出的两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法具有更好的性能.  相似文献   

9.
为了解决数据挖掘中关联规则Apriori算法存在的缺陷,提出了一种全新的基于对候选项集处理的改进算法。该算法主要采用一次扫描数据库和对候选项集进行计数处理的方法,实现了减少执行时间以及计算量的目的。实际应用表明,改进后的Apriori算法具有操作简便、测试准确的特点,达到了提高数据挖掘效率和准确性的要求。  相似文献   

10.
《信息技术》2015,(9):162-165
在当前处理大数据集的需求下,针对关联规则数据挖掘传统Apriori算法的不足,提出基于云计算平台并引入矩阵概念的一种改进算法,通过改进以减少传统Apriori算法的I/O负担严重、候选集数量巨大等问题,使其更好地适应大数据的频繁项集数据挖掘。  相似文献   

11.
基于线性链表的Apriori算法的改进   总被引:1,自引:1,他引:1  
Apriori算法是关联规则挖掘的一个经典算法,它使用一种称作逐层搜索的迭代方法,用(k-1)项集来探索k项集。每探索一个k项集,Apriori算法都需要扫描一次完整数据库。不断扫描数据库是影响Apriori算法运行效率的主要原因。文中基于线性链表对Apriori算法提出了一种改进方法。通过对数据库进行转换,以缩小探索k-项集时扫描的数据库,提高算法运行效率。  相似文献   

12.
文中在频繁项目集挖掘研究的基础上,针对Hadoop分布式计算框架,提出了一种基于子集的Apriori并行改进算法Sub Apr。该算法扫描数据库两次,将分块数据分配给不同的Hadoop计算节点进行处理,利用Apriori特性并结合MapReduce框架自身特点进行剪枝。该算法与同类算法比较,可以减少各个计算节点的存储数据,达到减少候选项集输出,有效减少了大数据集挖掘过程中产生的大量数据通信,从而提高并行挖掘的效率。实验结果表明,该算法是有效且可行的。  相似文献   

13.
针对电视导引头工作特性,系统分析了在光电技术领域中对电视导引头作用距离的主要影响因素,给出了电视导引头工作的数学模型,研究了不同因素对作用距离的影响。  相似文献   

14.
李玉飞 《现代电子技术》2007,30(3):60-61,64
对于采用海明码纠错的系统采说,提高纠错效率和可靠性对于提高数据传输速度和质量是很重要的,采用基于FPGA硬件设计的海明码纠错系统可以达到这一效果,分别从发送方海明码的生成和接收方纠错解码两方面详细阐述了该系统的实现原理,并给出了相应的Modelsim仿真时序波形图。  相似文献   

15.
基于邻井钻头优选算法的研究   总被引:3,自引:0,他引:3  
针对目前钻头选型的常用方法,主要讨论邻井钻头优选算法,该算法根据邻井钻头使用数据,对钻头的优选指标与钻头在钻井过程中的影响因素之间的对应关系建立数学模型,利用最小二乘法预测出各种钻头的优选指标,选择其中满足优选条件的钻头型号的方法.这种钻头优选算法将待选钻头置于同等比较条件下,具有很强的适用性和可靠性.  相似文献   

16.
在分析现有网络拓扑推测算法的基础上,提出了一种基于端到端报文丢失性能的网络拓扑推测方法,该方法通过比较节点间的Hamming距离和节点接收到的报文数量推测网络拓扑,在推测拓扑过程中不需要网络内部节点的协助。通过理论比较和分析,证明该方法在推测精度上比现有的方法有显著的提高,最后利用仿真实验验证了该方法的有效性和准确性,推测精度比现有方法提高了20%。  相似文献   

17.
汉明距离发生器实现方案的研究   总被引:2,自引:0,他引:2  
邹翊  王华 《电讯技术》2001,41(6):5-8
汉明距离是用来衡量2个二进制码字之间的相似程度的,本文主要针对用FPGA实现的汉明距离发生器,详细研究了其关键部件累加器的几种实现方案,给出了波形仿直结果时延及战胜FPGA资料的统计结果,提出了一种能大在缩短电路时延、提高运算速度并节省资源的实现方案,最终用FPGA实现并应用于一种卫星通信的帧同步系统中。  相似文献   

18.
关联规则挖掘Apriori算法的改进   总被引:2,自引:1,他引:1  
在介绍Apriori算法原理和实现过程的基础上,针对该算法存在的两个缺陷,即多次扫描事务数据库和产生大量的候选集,提出新的算法New_Apriori,该算法改变由低维频繁项目集到高维频繁项目集的多次连接运算,直接从1-频繁项目集产生高维频繁项目集,克服了Apriori算法的固有缺点,从而提高了运算效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号