期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种基于云计算的关联规则Apriori算法 总被引：1，自引：0，他引：1

张圣《通信技术》2011,44(6):141-143

关联规则是数据挖掘的重要方法之一,它基于支持度和置信度等对规则进行选择,以生成有用的规则。传统的关联规则算法需要读取数据库计算频繁集,开销巨大。随着云计算的发展,MapReduce编程架构已经成为云计算中的重要技术,针对Apriori算法的不足,设计了一种算法将云计算MapReduce框架进行了适当改进,并在此基础上编写了Apriori算法,以解决Apriori算法扩展性差的弱点。实验表明：该算法能有效提高Apriori算法的性能。相似文献

2.

云计算环境下基于MapReduce的Apriori算法研究

谭国强张丹平《江西通信科技》2012,(2):16-19

Apriori算法是一种经典的数据关联规则挖掘算法,本文借力云计算环境,根据MapReduce模型并行运行实现的特点,对Apriori算法进行优化,并行化改进后的MR-Apriori算法大大降低了时间消耗,其较强的扩展能力能更好地运用于大规模数据分析、处理和挖掘的需要. 相似文献

3.

一种改进Apriori算法

冯帆徐俊刚《电子技术》2012,(10):1-3

本文对关联规则挖掘中的经典算法--Apriori算法的关键思想以及性能进行了研究分析,并提出了该算法的一种改进算法。经过实验结果的对比分析可知,此改进算法的确提高了原算法的性能和执行效率。相似文献

4.

基于Hadoop的并行Apriori算法

《信息技术》2018,(4)

针对经典Apriori算法及其改进算法不能有效处理大规模数据集,提出基于Hadoop-MapReduce编程模型的两种改进算法:HAprioriK,HApriori2。其中HAprioriK需要k个MapReduce Jobs,而HApriori2仅需要2个就能在整个数据集上找到频繁k项集,两种改进算法均充分利用了Hadoop平台的计算优势,可以轻松地处理大量数据。采用IBM的数据集进行改进算法有效性的研究,实验结果表明,HApriori2算法在不同规模的数据集和支持度下,能够有效地挖掘频繁项集,具有比HAprioriK更好的性能。相似文献

5.

基于云平台MapReduce的Apriori算法研究

邵天会《电子技术与软件工程》2016,(20):206

随着医疗大数据剧增,医疗数据体现的价值更加明显,而传统的数据分析方案已经无法满足日益增长的数据要求,数据挖掘技术的更新更加体现出重要性,针对医疗数据挖掘算法的改进优化成为瓶颈,Apriori算法进行医疗数据的应用中发现众多优点,特别是基于兴趣度的改进算法,让医疗数据挖掘体现出更多的价值,并对改进的算法进行Map Reduce化进行模型实验,获得更多的医疗价值。相似文献

6.

一种基于矩阵的Apriori改进算法

《信息技术》2018,(3)

Apriori算法是经典的关联规则挖掘算法之一。该算法可以很好地挖掘关联规则,通过连接步和剪枝步从频繁项集中获取候选项集,但产生大量的候选项集,这就需要重复扫描数据库,大大增加算法运行时间。文中提出一种基于矩阵的改进算法,通过事务矩阵和候选项集项目矩阵相乘的矩阵操作来改进频繁扫描数据库的问题。事务数组的建立可以删除不能生成下一频繁项集的事务,删除不必要的项,针对频繁项集的产生过程优化Apriori算法的连接步和修剪步。在不同的数据集下通过实验验证改进算法不仅能准确地挖掘出频繁项集而且大大地缩短挖掘时间。相似文献

7.

一种新型的改进Apriori算法研究

白东玲郭绍永王晓贺新禹《信息技术》2013,(7):50-53

Apriori算法是数据挖掘关联规则研究中的经典算法,由于它需要多次扫描数据库,造成系统运行效率比较低。所以在对Apriori算法进行了分析之后提出了改进的Apriori算法。改进的主要思想是基于将事务数据库转化成相应的0-1矩阵,通过对矩阵中每个向量与其后的向量做内积运算来计算支持度,并将计算得到的支持度与给定的最小支持度作比较,删除小于最小支持度的行与列,缩小矩阵的规模,提高了运行速度效率。改进的算法只需要对数据库扫描一次,运行效率比较高。实验结果表明,该优化方案是有效可行的。相似文献

8.

一种改进的Apriori算法的研究

王平《数字技术与应用》2014,(12):132-133

本文对关联规则数据挖掘经典算法Apriori算法需要重复扫描数据库的不足提出了一种新算法。该算法在连接两个频繁（k-1）-项集时,对其事务标识符进行交计算,得到新的候选k-项集。避免了对数据库的频繁扫描,大大提高了算法效率。相似文献

9.

浅论Apriori算法的改进

《智能计算机与应用》2009,(5)

相似文献

10.

数据挖掘Apriori算法的改进

朱金坛《电子设计工程》2013,21(15):37-40

为了解决数据挖掘中关联规则Apriori算法存在的缺陷,提出了一种全新的基于对候选项集处理的改进算法。该算法主要采用一次扫描数据库和对候选项集进行计数处理的方法,实现了减少执行时间以及计算量的目的。实际应用表明,改进后的Apriori算法具有操作简便、测试准确的特点,达到了提高数据挖掘效率和准确性的要求。相似文献

11.

An Improved Apriori Algorithm

LIU Shan　LIAO Yongyi 《现代电子技术》2007,30(4):106-108

1 IntroductionKnowledge Discoveryin databaseis a newly useinfor-mation availably way that computer automatically pick upuseful information or knowledge fromhuge amounts of da-ta.KDD has been one of research hotspots in the field ofthe data base.Data minin… 相似文献

12.

基于矩阵的Apriori改进算法研究

付沙宋丹《微电子学与计算机》2012,29(5):156-160

针对关联规则中Apriori算法的不足之处,提出两种基于矩阵的Apriori改进算法.改进算法充分利用矩阵这一工具,以大幅度减少扫描数据库的次数和计算成本,进而有效提高算法的运算效率.同时,通过实例应用和算法性能分析证明所提出的两种改进算法都是有效的关联规则挖掘方法,且比Apriori算法具有更好的性能. 相似文献

13.

基于改进Apriori算法的气象数据质量控制研究

韩格格黄艳红姜娜娜徐晓庆《电子测试》2021,(5):63-64,8

针对传统气象数据质量控制算法存在的不足,首先提出将Apriori关联规则挖掘算法用于气象数据中,通过Apriori算法挖掘出关联规则;其次分析了Apriori算法存在的不足,提出了一种改进的MC_Apriori算法,通过真实数据仿真表明,新算法在时间性能上更加优越;最后,在原数据的基础上植入部分错误数据,通过与规则库中... 相似文献

14.

基于项集特性的关联规则挖掘中Apriori算法的改进 总被引：2，自引：0，他引：2

刘翠娟王保义秦艳凯《山西电子技术》2005,(6):20-22

提出一个改进Apriori的算法IApr,利用事务数据库的事务数相对于项集的项的个数而言要大得多这一特点,采用线性存储结构,并结合推出并证明的项集特性,考虑候选频繁项目集的各个项的应满足的条件,只需扫描一次事务数据库,有效减少了生成候选频繁项集的数目,从数据扫描量、搜索空间、时间复杂度上分析都提高了算法效率。相似文献

15.

基于压缩矩阵方式的Apriori改进算法 总被引：1，自引：0，他引：1

付沙廖明华宋丹《微电子学与计算机》2012,29(6):28-32,36

针对关联规则中Apriori算法的不足之处,提出两种基于压缩矩阵方式的Apriori改进算法,改进算法充分利用矩阵并对其进行压缩,以大幅度减少扫描数据库的次数,并提高频繁项集的生成效率,从而有效提升算法的运算效率,同时,.,通过实例应用和算法性能兮析证明所提出的两种改进算法部是有效的关联规则挖掘方法。且比Apri算法具有最好的性能. 相似文献

16.

挖掘关联规则中对Apriori算法的一个改进 总被引：12，自引：6，他引：12

芦洁刘志镜《微电子学与计算机》2006,23(2):10-12

文章针对关联规则中的Apriori算法进行了深入研究，提出了Apriori-I算法。由于这个算法只需要对交易数据库进行一次搜索。能大量减少所需的I/O次数，且内存开销适中，因此同其他关联规则算法相比具有快速的优点．适用于大型交易数据库。使用合成数据作试验表明这个算法尤其对大型数据库的性能优于先前已有的一些关联规则算法。相似文献

17.

基于MapReduce的PageRank算法的研究

陈宫牛秦洲《微电子学与计算机》2012,29(5):81-85

在对PageRank算法进行研究的基础上,利用MapReduce编程模型思想对PageRank算法进行改进,设计了在云平台Hadoop环境下运行的基于MapReduce的PageRank分布式并行算法,并在实验中对不同规模的Web图数据集进行了测试,分析不同的Blocksize参数对于算法计算性能的作用以及集群节点数目对于算法运行效率的影响. 相似文献

18.

基于MapReduce技术的并行集成分类算法

琚春华邹江波张芮魏建良《电信科学》2012,28(7):40-47

由于计算机内存资源限制,分类器组合的有效性及最优性选择是机器学习领域的主要研究内容.经典的集成分类算法在处理小数据集时,拥有较高的分类准确性,但面对大量数据时,由于多基分类器学习、分类共用1台计算机资源,导致运算效率较低,这显然不适合处理当今的海量数据.针对已有集成分类算法只适合作用于小规模数据集的缺点,剖析了集成分类器的特性,采用基于聚合方式的集成分类器和云计算的MapReduce技术设计了并行集成分类算法(EMapReduce),达到并行处理大规模数据的目的.并在Amazon计算集群上模拟实验,实验结果表明该算法具有一定的高效性和可行性. 相似文献

19.

基于进化算法的矢量量化索引值分配算法 总被引：4，自引：1，他引：3

下载免费PDF全文

李天昊余松煜张高《电子学报》2002,30(6):876-879

本文提出了一个基于进化算法的矢量量化（VQ）的码磁索引值分配算法（EAIAA）,该算法提出了一种有效的获得全局最优的索引值分配方法,在存在信道噪声的情况下,可以有效地提高矢量量化器的性能,实现了信道最优矢量量化器（COVQ）的设计,该算法利用进化算法的隐含并行性搜索方法和优胜劣汰的自然选择机制,可迅速寻找至全局最优解,克服了传统估化算法只能提供局部最优解的缺陷,实验结果表明该算法可获得比传统算法更高的性能增益。相似文献

20.

基于Hadoop的分布式哈希算法实现

仇李寅邱卫东苏芊廖凌《信息安全与通信保密》2011,9(11):54-56

互联网的发展使得计算密集型的任务正在逐渐走向分布式和云计算。文中对Hadoop项目中的MapReduce和HDFS进行了研究,采用HDFS作为底层分布式文件系统,MapReduce作为编程框架来实现哈希算法。通过对多个节点中的测试结果的分析表明,在Hadoop上运行哈希函数的任务,能够起到在多台计算机的群集中分摊负载的效果,并且有效地减少了任务的总时间开销。以Hadoop为基础的云计算平台具有良好的可靠性和可扩展性,对于哈希算法在Hadoop平台上的实现和测试,为将来密钥恢复等系统的研究和搭建提供了良好的基础。相似文献