首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
非对称广义特征值问题的并行处理是并行计算结构力学的重要部分,这方面的工作目前在国内外研究得还很少,将串行计算中求解非对称广义值问题AX=λBX(A、B为n阶实矩阵)行之有效的QZ算法1作了并行化处理,并就得到的并行QZ算法在ChallengeL并行机上进行了试算,数值结果表明,当处理机个数为2或4时并行效率良好,但当处理机个数为8时并行效率不高。  相似文献   

2.
自动确定聚类数和海量数据的处理是谱聚类的关键问题。该文提出了一种能自动确定类个数的谱聚类算法,该算法通过数据亲合矩阵的谱分解得到一系列特征值,再利用特征值差值分析来自动确定类个数。并通过对复杂分布数据和UCI数据库中的数据集进行实验,结果表明该算法不仅能找到合适的类个数,并且有较好的分类准确性。  相似文献   

3.
提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘. 采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题. 并给出了指导该并行算法高效计算的方法. 数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比.  相似文献   

4.
提出了C4.5决策树算法的一种并行算法,使传统的串行分类算法能在多台PC机和服务器组成的数据挖掘网格上并行数据挖掘. 采用数据纵横剖分,结合递归过程的并行化,实现了可扩展的高性能并行计算,解决了处理海量数据时没有较好并行分类算法的问题. 并给出了指导该并行算法高效计算的方法. 数据运行试验和算法分析表明,该并行算法的性能受多个因素影响,并具有高效的并行效率计算加速比.  相似文献   

5.
决策树算法是数据挖掘中重要的分类算法,但目前多数针对决策树的改进方法都基于传统的串行算法,不能满足大数据环境下对海量数据挖掘的需要.针对大数据集中串行挖掘算法效率低下的问题,采用MapReduce对决策树算法进行了并行化实现,同时引入修正参数来改进ID3算法倾向于多值属性选取的问题.实验结果表明,该算法具有较好的并行性和扩展性,能有效处理大数据集的分类问题.  相似文献   

6.
针对多态同构阵列处理器,提出一种图形算法并行化的实现方法。该方法通过分析图形流水线中渲染算法的控制依赖、数据依赖关系,并对各个算法计算量进行估计,利用多态阵列处理机的能够结合不同类型的并行计算的特点,以处理器的负载均衡为依据,实现图形渲染的并行化计算。实验结果表明,该方法所实现的加速比按线性增长。  相似文献   

7.
一种基于本体的并行网络流量分类方法   总被引:1,自引:0,他引:1  
海量网络流量数据的处理与单一节点的计算能力瓶颈这一矛盾导致数据分类效率低,无法满足现实需求。为解决这一问题,结合本体与MapReduce技术各自在海量异构数据描述与处理方面的优势,提出一种基于本体的并行网络流量分类方法。该方法基于MapReduce并行计算架构,根据网络流量本体结构,对网络流量本体并行化构建;通过并行知识推理完成基于流量统计特征的网络流量分类。实验结果表明,集群环境下基于MapReduce的网络流量本体构建效率明显高于单机环境,而且适当增加计算节点使得加速比线性提升;并行知识推理的分类方法能够有效地提高大规模网络流量的分类效率。  相似文献   

8.
随着信息技术的发展,大量的数据不断被收集和存储,对数据的挖掘规模越来越大,传统的数据挖掘已经无法解决海量数据挖掘问题。网格技术的发展,使得广域分布的海量数据的挖掘问题得到解决。文章根据现实中海量数据挖掘的需求和网格的本质,把并行关联规则挖掘算法应用于网格数据挖掘中,并建立了一个并行数据挖掘模型,验证了并行数据挖掘系统在网格环境的可行性与合理性。  相似文献   

9.
针对传统FHT算法在处理海量数据时不能很好的满足实时性需求,该文提出了一种基于CUDA高效的并行FHT算法。通过分析FHT算法的分治特性及CUDA的编程模型,采用了将数据映射到多线程并行运算的方法,实现了对FHT算法的加速和优化。实验结果表明,新的并行算法可以有效地提升FHT处理速度,且随着数据规模的增长,加速效果越明显。  相似文献   

10.
机载Li DAR点云数据是遥感大数据的重要组成部分,基于单机的处理算法已经无法满足海量点云数据处理的要求。首先,针对现有单机多级移动曲面拟合滤波算法存在粗差和拟合曲面精度不高的问题,提出适合海量机载Li DAR点云数据滤波的多级多窗口移动曲面拟合滤波算法(WHMCFA);其次,设计并实现基于MapReduce的PWHMCFA并行滤波算法;最后,实验证明这种并行滤波算法在保证精度的前提下实现了海量机载Li DAR点云数据的快速滤波。  相似文献   

11.
关联规则是数据挖掘研究的一个重要课题 ,而最大频繁项集的生成是影响关联规则挖掘的关键问题 .在已有的频繁集发现算法中 ,DLG算法通过减少事务数据库的扫描次数 ,进而有效减少挖掘过程的I/O代价 .在阐述DLG算法的实现原理与执行过程的基础上 ,为进一步减少候选项集的数量 ,提出一种改进算法DLG .其主要思想是在关联图构造阶段 ,统计每一个频繁项目的入度 ,以此作为剪枝的依据 .性能分析和比较试验的结果表明该算法性能优良  相似文献   

12.
快速发现关联规则挖掘算法的并行化方法   总被引:1,自引:0,他引:1  
分析挖掘关联规则主要并行算法及性能.针对算法中负载平衡和时间响应问题,提出一种高效可行的挖掘关联规则的NA(Ntransactionalgorithms)并行算法,给出了NA算法的策略.通过前期实验结果表明,这种快速发现关联规则的并行算法在计算大项集过程中不需要同步和交换数据,在任意情况下,可独立计算局部大项集.  相似文献   

13.
针对并行关联规则挖掘算法不能有效的解决负载平衡的问题,在CD算法的基础上,介绍了一种基于动态数据集划分的并行关联规则挖掘算法.它根据各个节点的反馈来决定向每个节点分配的数据集大小.与静态的数据集划分相比,它能更好地实现负载平衡,提高并行数据挖掘的效率.  相似文献   

14.
关联规则挖掘算法是通信网告警相关性分析中的重要方法。在处理数量庞大的告警数据库时,算法的效率显得至关重要,而经典的FP-growth算法会产生大量的条件模式树,加权算法MINWAL (O)则需要多次扫描数据库,使得在通信网环境下挖掘关联规则的难度非常大。该文提出了一种高效的基于加权频繁模式树的通信网告警关联规则挖掘算法,算法性能测试表明,该算法与已有的加权关联规则挖掘算法相比较,节约了大量的存储空间,提高了算法的挖掘速度,对通信网的故障诊断和故障定位有着积极的意义。  相似文献   

15.
Apriori算法是挖掘关联规则频繁项集的最有影响的算法之一,它通过连接、剪枝等步骤产生频繁项集,进而产生强关联规则。由于面临海量数据,因此将会产生大量的候选项集,尤其是候选2-项集,严重影响了挖掘的效率。提出了一种改进的算法,此算法不产生小项候选集而直接产生大项候选集,从而提高了算法的效率。  相似文献   

16.
传统的关联规则并行挖掘算法中存在着产生大量的候选项集和通信量高的缺点,本文在分析已有并行挖掘关联规则算法的优缺点的基础上,提出了一个效率较高的并行优化关联规则挖掘算法EPMAR(Efficient Parallel Mining Association Rules),并与其它相应的算法进行了比较.实验结果证明:算法EPMAR是有效的,具有一定的扩展性.  相似文献   

17.
基于FP-tree的快速数据挖掘算法   总被引:1,自引:0,他引:1  
针对挖掘全局频繁项集的算法大多采用的类Apriori算法存在通信量大、同步次数和数据库扫描次数较多等问题,提出了一种基于频繁模式树的快速挖掘全局频繁项集算法(FAMGFI).该算法让各计算机结点采用FP—growth算法独立地计算局部频繁项集,然后与中心结点交互实现数据汇总,最终获得全局频繁项集.FAMGFI算法采用自顶向下和自底向上策略,能大大降低通信量.理论分析和实验结果表明FAMGFI算法是快速而有效的.  相似文献   

18.
针对结构化数据进行关联规则挖掘的经典Apriori算法和由W3C推出的XML文档查询语言XQuery相结合,设计并实现了一个针对XML文档进行挖掘的算法XQ-Apriori.该算法可以直接对包括电子病历在内的各种XML格式的文档进行关联规则挖掘,挖掘过程无需进行数据转换。测试表明,该算法具有较高的效率。  相似文献   

19.
Based on the rough set theory which is a powerful tool in dealing with vagueness and uncertainty, an algorithm to mine association rules in incomplete information systems was presented and the support and confidence were redefined. The algorithm can mine the association rules with decision attributes directly without processing missing values. Using the incomplete dataset Mushroom from UCI machine learning repository, the new algorithm was compared with the classical association rules mining algorithm based on Apriori from the number of rules extracted, testing accuracy and. execution time. The experiment results show that the new algorithm has advantages of short execution time and high accuracy.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号