首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为解决当前原型学习算法在大规模、大类别机器学习和模式识别领域的计算密集瓶颈问题,提出一种采用GPU和CPU异构并行计算架构的可扩展原型学习算法框架.一是通过分解和重组算法的计算任务,将密集的计算负载转移到GPU上,而CPU只需进行少量的流程控制.二是根据任务类型自适应地决定是采用分块策略还是并行归约策略来实现.采用大规模手写汉字样本库验证本框架,在消费级显卡GTX680上使用小批量处理模式进行模型学习时,最高可得到194倍的加速比,升级到GTX980显卡,加速比可提升到638倍;算法甚至在更难以加速的随机梯度下降模式下,也至少能获得30倍的加速比.该算法框架在保证识别精度的前提下具有很高的可扩展性,能够有效解决原有原型学习的计算瓶颈问题.  相似文献   

2.
在分析基于CPU-GPU异构计算模式程序开发面临的主要挑战和当前解决途径的基础上,设计了一种适用于GPU集群环境的、综合利用MPI、OpenMP、CUDA以及OpenGL API开发技术的混合编程模型,重点分析了混合编程模型的两种编程方式的实现原理,搭建了相应的实验环境并进行了对比测试。实验结果表明,使用混合编程模型设计的程序具有良好的性能表现和扩展潜力。  相似文献   

3.
4.
To achieve the across-nodes technology of the heterogeneous parallel method of moments (MoM), a parallel MoM programming model is studied on CPU/GPU and CPU/MIC heterogeneous platforms. By utilizing the CONTEXT technology in the CUDA which contains the GPU common programming criterions, and the concept of environment variables in MIC, a general heterogeneous parallel programming model for the CPU/GPU and CPU/MIC is proposed, which meets the static load-balancing for the across-nodes heterogeneous parallel MoM. Numerical results show that the heterogeneous parallel MoM codes based on the proposed parallel programming model can obtain ideal speedup and good scalability.  相似文献   

5.
针对传统的并行核外编程复杂、虚存系统性能不理想的问题,提出一种基于PVFS的并行核外计算方法,描述了其软件层次结构、数据访问策略及实现,为工作站机群用户提供了方便的编程接口以及核外数据的全局视图.实验结果表明,该方法扩展了可有效解决的核外问题规模,大数据量时的计算性能优于虚存系统.  相似文献   

6.
提出并行计算熵的概念以及基于并行计算熵的同构集群负载均衡算法.理论分析证明并行计算熵作为系统负载均衡程度度量的合理性.算法以并行计算熵来衡量集群系统中节点之间负载均衡程度,以节点任务运算量来衡量节点的负载信息,并根据并行计算熵来进行负载迁移决策.实验证明相对基于任务数阈值的负载均衡算法并行计算性能有一定提高.  相似文献   

7.
分析了平面钢闸门的工作特点,研究和建立了平面钢闸门的精细组合有限元计算模型并进行了并行计算。提出了并行求解策略;采用循环分解技术来实现单元刚度矩阵生成的并行化,采用预处理共轭梯度法并行求解系统方程组。获得了较高的并行计算效率和合理的计算结果,明显减小了结构计算时间。  相似文献   

8.
针对并行计算机不同的数据存储方式,分析对比了基于多核和众核体系结构的共享存储并行编程模型和分布式存储并行编程模型,以CUDA和OpenCL为例介绍了基于异构计算机系统的并行编程模型,指出基于异构平台的混合编程在今后的大规模并行应用中必将成为主流。  相似文献   

9.
基于动态规划法提出了寻找最短路程的并行化方法,该方法将递推计算问题影射到两个线性阵列结构上并行实现,提高了计算的实时性。该方法也可用于动态规划法并行求解其它多级决策过程。  相似文献   

10.
借助分割数据技术优化了经典的Apriori算法,实现了对候选项集的分组统计。给出了优化Apriori算法的MapReduce编程实现模型,达到了Apriori算法并行化的目的。实验结果表明,该算法能够大量减少键/值对的产生,提高了算法的效率,并且随着挖掘频繁项目集节点数的增加,算法的加速比成线性提高。  相似文献   

11.
移动边缘计算可以将用户任务卸载至边缘服务器,以减少移动设备的能耗与时延。通过研究边缘计算场景,提出了一种自适应动态规划算法,以优化用户的卸载决策。所提算法采用创新的比特流填表方式以节省计算时间,同时在满足时间约束的条件下减小能耗与时延。结果表明,该算法可在满足应用程序执行时间约束的前提下找到近似最优解,同时在不损失计算效率的前提下处理较大的卸载问题。  相似文献   

12.
针对WebGIS在税务系统应用中遇到的对地图数据要求动态更新和动态匹配的问题进行了分析和研究,给出动态匹配的方法和实现,结合并行计算相关理论,证明了对纳税户到街道的动态匹配过程进行分布式程序设计的可行性,应用分布式程序设计解决了匹配过程中的速度问题。  相似文献   

13.
1INTRODUCTION Withthedevelopmentofcomputertechnolo gies,dataprocessing,transferringandstoringareadvancedgreatly.ButtheperformanceofI/Osub systemisnotimprovedaccordingly.SotheI/Osubsystembecomesabottleneckofthehighper formancecomputing[13].Theeffectivemethodofsolvingtheproblemreliesonsoftware,thatis,tostoreandaccessdatainparallelI/Oacrossmulti nodesofclusterintermsofsomefileallocatingstrategies[4].TheprofessionalpracticeprovesthatparallelI/Oisaneffectivemethodtoeliminatethebottleneck.T…  相似文献   

14.
Disconnection in the distributed heterogeneous networked unmanned weapon systems is caused by multiple weapon units' failure. The technical routes were analyzed to achieve resilience in the disconnection situation. A heterogeneous distributed network model of networked unmanned weapon systems was established. And an approach of adding relay weapon units was proposed to achieve fault tolerance after weapon units' failure due to attack or energy exhaustion. An improved genetic algorithm was proposed to determine and optimize the position of the relay weapon units. Simulation results in the MATLAB show that the improved resilience-based genetic algorithm can restore the network connection maximally when the number of relay units is limited, the network can keep on working after failure, and the implementation cost is controlled in a reasonable range.  相似文献   

15.
在分析广域电力系统整体建模需求的基础上,提出广域电力系统整体建模并行化的方案,设计基于粒子群算法的并行优化算法,开发相关软硬件系统.通过算例系统进行测试,结果证明了广域电力系统整体建模的可行性与有效性,显示了并行化方法在整体建模计算时间上的优越性.表明该电力整体建模的并行计算技术具有较强的工程实用价值.  相似文献   

16.
为了实现路径规划并行优化,解决基于位置的服务(LBS)在高峰时段遭遇大量路径规划的并发查询所导致的较高响应时间的问题,提出双层网格(DLG-index)索引,并基于此提出路径规划的并行算法(PORP). 双层索引的顶层由完整路网的边界节点组成,底层由网格组成,网格由完整路网分割而来. 对于一个给定的查询,基于骨架图计算一条全局路径,然后将规划任务划分成多个局部优化任务. 每个局部优化任务对应此查询的全局路径通过的网格,同时,每个局部优化任务由不同的处理器独立维护. 算法能够基于复杂变化的路况,及时调整导航路线,整个调整过程分段实施,可以由多处理器依次协同完成,实现对海量并发查询做出快速响应. 与CANDS算法相比,PORP的响应时间平均减少了49.6%,处理时间平均减少了28.5%.  相似文献   

17.
依据现代GPU在通用计算方面的功能,提出了基于Brook在GPU上执行通用计算的实现方法,运用图像分割、快速傅立叶算法和光线跟踪3个应用对该方法进行了评估。评估结果表明GPU在Brook环境下通用计算能力优于CPU。  相似文献   

18.
The fundamental problem of multi-user computation offloading for Mobile Edge Computing is investigated in heterogeneous overlay networks where each user can connect and offload its computing workloads to multiple heterogeneous wireless access points in parallel. The problem of average user overhead minimization with the delay constraint is formulated to obtain the optimal strategy of workload partition and heterogeneous resource allocation. A successive convex approximation (SCA) based algorithm is finally developed, which addresses the problem of non-convex optimization by iteratively solving a sequence of separable strongly convex problems. Numerical results are presented to prove that the proposed offloading mechanism can effectively reduce the service latency and energy consumption of users compared with the conventional non-cooperative approach.  相似文献   

19.
一种基于GPU加速的细粒度并行粒子群算法   总被引:4,自引:0,他引:4  
提出了一种基于GPU加速的细粒度并行粒子群算法,将并行PSO求解过程转化为GPU纹理渲染过程,使PSO算法在GPU中加速执行,在取得了较好的优化效果的同时,增大了细粒度并行的粒子规模,提高了算法的运算速度,并为普通用户的并行PSO工作提供了一种可行的方法.  相似文献   

20.
在初步分配了各分系统的可靠度Rk和冗余数ak的基础上,针对冗余数ak≥1的分系统,应用动态规划的方法,对其中单个部件的局部电路或某些元件进行冗余设计,提高了单个部件的可靠度,降低分系统的冗余数,从而使分系统的成本、重量和体积减小,这是一种具有工程应用价值的局部动态规划方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号