首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
异构多核图形处理器存储系统设计与实现   总被引:1,自引:1,他引:0  
提出了异构多核图形处理器(HMGPU)存储管理系统的硬件实现方法,采用固定分区与分页式分区两种方式分别对大片连续数据与小片非连续数据进行管理,使用Verilog语言进行硬件设计和仿真,并在FPGA开发板上进行了验证。实验结果表明,该系统为HMGPU提供了2 021.2 MB/s的有效存储带宽。  相似文献   

2.
一种面向异构众核处理器的并行编译框架   总被引:1,自引:0,他引:1  
异构众核处理器是面向高性能计算领域处理器发展的重要趋势,但其更为复杂的体系结构使得编程难的问题更加突出.针对这一问题,基于开源编译器Open64,提出了一种面向异构众核处理器的并行编译框架,将程序自动转换为异构并行程序.该框架主要包括4个模块:任务划分模块用来识别适合进行加速计算的程序段,实现了嵌套循环的多维并行识别方法;数据布局模块完成数据在主存和SPM之间的布局,实现了数组边界分析和指针范围分析;传输优化模块实现了数据传输合并、传输外提、打包传输、数组转置等多种数据传输优化方法;收益评估模块在构建代价模型的基础上实现了一种动静结合的收益评估方法.并且,基于SW26010处理器,对该编译框架进行了实现,测试结果表明,该编译框架能够实现一些程序以面向异构众核结构的并行变换,且获得较好的加速效果.  相似文献   

3.
何希  吴炎桃  邸臻炜  陈佳 《计算机应用》2019,39(7):2008-2013
形态学重建是医学图像处理中非常基础和重要的操作。它根据掩膜图像的特征对标记图像反复进行膨胀操作,直到标记图像中的像素值不再变化为止。对于传统基于中央处理器(CPU)的形态学重建系统计算效率不高的问题,提出了使用图形处理器(GPU)来加速形态学重建。首先,设计了适合GPU处理的数据结构:并行堆集群;然后,基于并行堆集群,设计和实现了一套基于GPU的形态学重建系统。实验结果表明,相比传统基于CPU的形态学重建系统,基于GPU的形态学重建系统可以获取超过20倍的加速比。基于GPU的形态学重建系统展示了如何把基于复杂数据结构的软件系统高效地移植到GPU上。  相似文献   

4.
基于图形处理器的并行方体计算   总被引:1,自引:0,他引:1  
方体(cube)计算是数据仓库和联机分析处理(Online analytical processing,OLAP)领域的核心问题,如何提高方体计算性能获得了学术界和工业界的广泛关注,但目前大部分方体算法都没有考虑最新的处理器架构.近年来,处理器从单一计算核心进化为多个或许多个计算核心,如多核CPU、图形处理器(Graphic Processing Units, GPU)等.为了充分利用现代处理器的多核资源,该文提出了基于GPU的并行方体算法GPU-Cubing,算法采用自底向上、广度优先的划分策略,每次并行完成一个cuboid的计算并输出;在计算cuboid过程中多个分区同步处理,分区内多线程并行.GPU-Cubing算法适合GPU体系结构,并行度高.与BUC算法相比,基于真实数据集的完全方体计算可以获得一个数量级以上的加速比,冰山方体获得至少2倍以上的加速.  相似文献   

5.
流线是流场可视化的主要方法之一,而针对大规模流场的流线生成由于计算量大往往需要采用高性能计算机这样的并行计算环境结合并行化算法以实现计算加速.在当前异构计算系统越来越普遍的情况下,为了充分利用并行异构计算环境的计算能力,实现更高效的并行流线生成,本文采用了基于数据并行原语结合分布式消息通讯的技术架构,设计了一套适用于异...  相似文献   

6.
姚楠  杨楠 《微计算机应用》1997,18(5):261-261
在设计新的校级MIS系统时,为了能充分利用原有的数据又不破坏这些系级MIS,我们在校园网上设计了一个异构数据库联合使用系统HDBUS。HDBUS是将分布在网络不同节点上的ORACLE,SYBASE数据库服务器及FoxPro台式数据库中的本地库(LocalDataBase)集成为一个全局库(Global DataBase)并提供全局事务管理和并行查询处理的异构分布式数据库系统。HDBUS选用PB(PoweBuilder)作为主要的开发工具,然而作为客户端工具,我们发现它不支持数据库服务器间的并行工作,因此提出了在PB应用程序与数据库  相似文献   

7.
随着各个行业的需要,频繁项集挖掘算法需要处理大量的、连续不断的、动态的数据,算法的计算量非常大,为了提高算法的性能,可以使用CPU和GPU的架构,用GPU的并行计算提高算法的性能。  相似文献   

8.
图形生成填充方式研究   总被引:1,自引:0,他引:1       下载免费PDF全文
填充是图形生成中关键性的一步,其效率直接影响到整个图形生成系统的性能。本文首先讨论了几种常用的填充算法的局限性,然后提出了一种更有效的凸多边形填充算法,并详细说明了该算法在抗混叠。  相似文献   

9.
现有的并行代价模型大多是面向共享存储或分布存储结构设计的,不完全适合异构多核处理器。为解决这个问题,提出了面向异构多核处理器的并行代价模型,通过定量刻画计算核心运算能力、存储访问延迟和数据传输开销对循环并行执行时间的影响,提高加速并行循环识别的准确性。实验结果表明,提出的并行代价模型能有效识别加速并行循环,将其识别结果作为后端生成并行代码的依据,可有效提高并行程序在异构多核处理器上的性能。  相似文献   

10.
并行构件技术的出现提高了并行软件的开发效率,但现有的并行构件技术缺乏对异构多核平台的支持.为了提高并行构件程序在异构平台上的执行性能,扩展CCA(通用构件体系结构)并行构件模型支持CCA异构并行构件,提出了一种异构的CCA并行构件模型.使用管理者—工人模式调度CCA异构并行构件内的计算任务到异构多核平台上加速执行.在CCA构件工具包的基础上实现了支持扩展CCA并行构件模型的编译系统和运行时框架.在CELL BE和GPU两种异构多核处理器上进行的实验证明了提出的方法比原始的CCA构件程序具有较优的性能.提出的并行构件模型应用在并行程序开发中可以提高并行程序的性能.  相似文献   

11.
本文讨论了动态矩形交查询算法.文中介绍了两个半动态矩形查询的新算法,它们分别基于一维数据结构和二维数据结构.一维查询算法的查询时间复杂度是O(logMk′),更新时间复杂度是O(logMlogn),空间复杂度是OnlogM/).二维查询算法的查询时间复杂度是O(log2Mk),更新时间复杂度是O(log2Mlogn),空间复杂度是Onlog2M).本文分别实现了这两个算法,通过对它们的性能进行比较,发现一维查询算法是一种高效、实用的算法.  相似文献   

12.
在三维结构搜索中可种算法作构象搜索对系统的搜索速度和命中率有极大的影响。本文在自行的三结构搜索系统3DFS的基础上对遗传算法和POWELL法的构象搜索能力进行了比较,五个典型药效团的搜索结果表明,两种算法在速度和优化能力上各有优势。应视系统的要求区别使用。  相似文献   

13.
指纹匹配是自动指纹识别中的重要环节。首先介绍了指纹匹配中已有的一些方法和指纹匹配需要解决的问题,继而提出了一种基于中心区域基准点的指纹匹配算法,通过搜寻中心区域的细节点集合定位基准点对,以此计算旋转和平移参数,最后统计姿势矫正后的匹配点个数来实现两枚指纹的比对。实验结果表明,针对图像质量不同的两个指纹库,该算法能有效地抵抗图像噪声,准确定位基准点,达到较高的准确率。  相似文献   

14.
自动区域划分的分区域搜索狭义遗传算法   总被引:8,自引:0,他引:8  
用数学方法难以解决函数优化中的区域划分问题.为此,提出了用狭义遗传算法实现区域划分的方法.实现了基于自动区域划分的分区域搜索的狭义遗传算法,阐述了分区域搜索的控制策略。从理论上分析了基于自动区域划分的区域搜索的狭义遗传算法是全局收敛的,并具有收敛速度快、搜索过程稳定性高、可控制性强、便于并行实现等特点.最衙提出了有待研究的问题。  相似文献   

15.
一种基于散乱点云的边界提取算法   总被引:1,自引:0,他引:1  
点云边界是曲面的重要特征之一,边界线的快速准确提取对于提高曲面重构的效率和质量具有重要意义。首先,采用基于kd-tree搜索的方法建立点云空间拓补关系,进行K邻域快速搜索,以采样点及其K邻域作为局部型面参考依据拟合微切平面,将其向微切平面投影;其次,在微切平面上建立局部坐标系,并对投影点进行参数化,根据邻域点集在采样点处的场力大小之和可以表示点集的平均作用来识别点云的边界特征点;最后,从提高边界线连续性的角度,利用NURBS曲线插值方法连接边界线。实验结果表明,该算法可以快速、有效地提取出点云的边界特征点,并得到C2连续的边界线,满足曲面重构的要求。  相似文献   

16.
属性约简自寻优算法   总被引:24,自引:1,他引:24  
属性约简是知识获取中的关键问题之一。为了能够较为有效地获得较优的属性约简,首先在粗糙集理论的基础上构造出了相对差异比较表,然后把它与启发性知识相结合分别设计出了3个算法:属性约简的改进算法(AR1),属性约简判定的完备算法(RJ)和属性约简的改进增强算法(AR2);接着,将这些算法作为子算法并吸收了基因算法的基本思想和模拟退火算法的具体操作,设计出了属性约简自寻优算法(ADSOA);最后,将该算法应用于中医类风湿关节炎诊断决策表的约简。实验结果表明,属性约简自寻优算法能够以较大的概率和较高的效率获得较优的属性约简,对于某些具体问题来说甚至能够获得最佳的属性约简;这也同时表明相对差异比较表的提出对于进一步构造效率更高的属性约简算法具有较大的实际意义。  相似文献   

17.
为了提高大规模网络数据搜索的效率,提出了一个基于网格机制的Internet网络数据搜索模型。利用网络跳距离、数据搜索节点密度、计算节点能力和可信性机制以及市场服务代价原则,给出了DSG结构和算法。描述了基于DSG的网络数据搜索过程。  相似文献   

18.
随着CAD技术的日益普及,越来越复杂的设计对象进入系统,这就不可避免地导致了系统时空优化问题。目前实体造型中的主要表示方法,即边界模型及构造模型,由于各自特写的结构,无法较好地满足实际工程的需要。本文通过分析实体边界构造过程,提出了一个基个交线存储的实体存储方式及边界重构算法,该方法具有实体数据存储空间小,边界生成速度快等特点,较好地解决了系统存在的时空优化问题。  相似文献   

19.
对Petri网的深入研究有助于基于Petri网的工作流管理系统的开发,S组件可用来刻画Petri网的一些重要特性.给出了一种在Petri网中查找S组件的算法.实验结果证明该算法是切实可行的.  相似文献   

20.
软件复用库的模糊表示与查询方法   总被引:4,自引:0,他引:4  
软件复用库是一种珍贵的软件资源,但是若没有很好地解决可复用软件部件的表示与查询问题,就不能切实有效地支持软件复用,本文介绍了模糊关键词、模糊分类、模糊超文本三种表示查询方法,提出一种能够根据使用记录自适应调整的动态模式,以便使软件复用库的表示模式与程序员的理解模式一致起来,实验表明,模糊方法能够有效地帮助程序员检索所需的软件部件。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号