首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 100 毫秒
1.
赵军 《现代计算机》2008,(6):122-122
最近一段时间,关于“在PC机中,是CPU重要还是GPU重要”,“是CPU要融合GPU,还是GPU要取代CPU”是业界比较热闹的话题之一。  相似文献   

2.
CPU与GPU各有所长。CPU的资源多用于缓存,而GPU的资源多用于数据计算。将CPU技术就进行比较,希望创造具有高性能处理器与独立显卡的处理性能,从而提高了电脑的运行效率,提高更好的性价比,使其为我们带来更好的选择。  相似文献   

3.
应用GPU集群加速计算蛋白质分子场   总被引:1,自引:2,他引:1  
针对生物化学计算中采用量子化学理论计算蛋白质分子场所带来的巨大计算量的问题,搭建起一个GPU集群系统,用来加速计算基于量子化学的蛋白质分子场.该系统采用消息传递并行编程环境(MPI)连接集群各结点,以开放多线程OpenMP编程标准作为多核CPU编程环境,以CUDA语言作为GPU编程环境,提出并实现了集群系统结点中GPU和多核CPU协同计算的并行加速架构优化设计.在保持较高计算精度的前提下,结合MPI,OpenMP和CUDA混合编程模式,大大提高了系统的计算性能,并对不同体系和规模的蛋白质分子场模拟进行了计算分析.与相应的CPU集群、GPU单机和CPU单机计算方法对比,该GPU集群大幅度地提高了高分辨率复杂蛋白质分子场模拟的计算效率,比CPU集群的平均计算加速比提高了7.5倍.  相似文献   

4.
本文将球谐函数应用在分子表面模拟上,以解决生物大分子(蛋白质)与生物大分子(蛋白质)之间的对接(dock),为药物分子设计的研究奠定理论基础。  相似文献   

5.
蛋白质种类和小分子的数量过多,对于药物的模拟开发运算量巨大。而分子对接是研究新药的重要手段,因此提高分子对接实验系统的工作效率十分重要。分子对接主要目的是研究蛋白质受体和配体小分子之间的作用与联系。本文通过模拟实验,搭建了一个Hadoop平台,并利用Hadoop强大的并行计算能力对蛋白质(1ppe与1uy6)与多组数量不同的配体小分子进行对接,最后对工作过程进行了相应的比较与优化。实验结果表明,该系统可以有效提高对接效率,并且具有较好的稳定性和便利性。  相似文献   

6.
为了研究β-环糊精与胆汁酸形成包结物的稳定性和分子识别机制,采用自行研制的柔性对接算法对β-环糊精和不同胆汁酸的分子识别进行了分子力学模拟,并和刚性对接方式进行了比较。结果表明:柔性对接优化得到的结构比相应的刚性对接得到的结构更合理;包结物的稳定性随着胆汁酸所含羟基数目的增加而降低;对于含有相同羟基数目的胆汁酸,羟基的位置及其取向对包结物的稳定性也存在影响;范德华能和去溶剂化能是影响包结物稳定性的主要因素。  相似文献   

7.
分子对接同的之一,是找出配体和受体之间最稳定构像的结合模式,可以归为全局搜索或优化问题.本文提出的鼍子行为粒子群优化算法(QPSO)是1种有效的全局优化搜索算法.本文介绍QPSO算法在分子对接问题研究中的应用,并使用Autodock3.05的打分函数评价分子对接结果.结果表明,QPSO算法的QDOCK程序能够寻找出更为稳定的构像,且其收敛速度以及对接结果的精确性均比拉马克遗传算法(LGA)的Autodock3.05好.  相似文献   

8.
近年来,基于GPU的新型异构高性能计算模式的蓬勃发展为众多领域应用提供了良好的发展机遇,国内外遥感专家开始引入高性能异构计算来解决高光谱遥感影像高维空间特点所带来的数据计算量大、实时处理难等问题。在此简要介绍了高光谱遥感和CPU/GPU异构计算模式,总结了近几年国内外基于CPU/GPU异构模式的高光谱遥感数据处理研究现状和问题;并面向共享存储型小型桌面超级计算机,基于CPU/GPU异构模式实现了高光谱遥感影像MNF降维的并行化,通过与串行程序和共享存储的OpenMP同构模式对比,验证了异构模式在高光谱遥感处理领域的发展潜力。  相似文献   

9.
蛋白质-肽段对接时受体的骨架柔性问题一直以来都是计算生物学中的一个挑战。目前,绝大多数的对接都是一种半柔性对接(只考虑配体的柔性)。然而在真实的对接过程中,受体也会产生构象变化,包括侧链运动、骨架运动或其它突变。本文提出了一种包含受体骨架柔性的蛋白质-肽段柔性对接方法。在8个较难的Unbound蛋白质-肽段复合物和2个受体有明显柔性区域的对接案例上进行了测试。分析表明本文提出的这种柔性对接方法在受体有明显柔性区域的案例上都取得了很大的改进。  相似文献   

10.
分子对接是研究蛋白质-配体分子间相互作用与识别的有效方法。分子间的相互作用过程中形成的近天然构象是结合自由能极低的构象,快速且准确搜索能量极低的构象对于蛋白质-配体分子对接至关重要。本文回顾了蛋白质-配体分子对接中主要的构象搜索算法,包括快速穷举搜索、启发式搜索和其他搜索方法,并列举了采用不同搜索算法的代表性分子对接软件。其次,介绍了蛋白质-配体分子对接的国际评估实验、常用的测试标准库和评价的重要指标。最后,分析并指出了当前蛋白质-配体对接构象搜索方法所存在的主要问题,并对未来的工作进行了展望。  相似文献   

11.
ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共享内存、合并访存,提高了数据访问效率。之后对ASIFT计算中的其它部分进行GPU优化,形成GASIFT。整个GASIFT计算过程中使用显存池来减少对显存的申请和释放。最后分别在CPU/GPU协同工作的两种方式上进行了尝试。实验表明,CPU负责逻辑计算、GPU负责并行计算的模式最适合于GASIFT计算,在该模式下GASIFT有很好的加速效果,尤其针对大、中图片。对于2048*1536的大图片,GASIFT与标准ASIFT相比加速比可达16倍,与OpenMP优化过的ASIFT相比加速比可达7倍,极大地提高了ASIFT在实时计算中应用的可能性。  相似文献   

12.
提出一个多核CPU/GPU混合平台下的集合求交算法.针对CPU端求交问题,利用对数据空间局部性和中序求交的思想,给出内向求交算法和Baeza-Yates改进算法,算法速度分别提升0.79倍和1.25倍.在GPU端,提出有效搜索区间思想,通过计算GPU中每个Block在其余列表上的有效搜索区间来缩小搜索范围,进而提升求交速度,速度平均提升40%.在混合平台采用时间隐藏技术将数据预处理和输入输出操作隐藏在GPU计算过程中,结果显示系统平均速度可提升85%.  相似文献   

13.
针对集群显示系统中存在的CPU多核闲置、GPU利用不足、CPU与GPU结合困难等问题,研究了CPU多核多线程处理、GPU并行处理及CPU+GPU整合运算等技术,提出并构建了CPU+GPU集群并行显示系统,提升了集群并行显示系统的综合运算能力,实验结果表明CPU+GPU集群并行显示技术是有效的,为海量信息高速显示提供了有效的解决方案。  相似文献   

14.
波束形成的实时性一直是声纳和雷达等领域信号处理过程中的重点和难点。本文采用基于CUDA(Compute Unified Device Architecture,统一计算设备架构)的GPU(Graphic Processing Unit,图形处理器)与CPU协作处理方法,实现了宽带波束形成的实时处理。本方法的处理速度相较于matlab和CPU平台可以提高一至两个数量级,相较于同等处理速度的多DSP平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。  相似文献   

15.
当前世界上排前几位的超级计算机都基于大量CPU和GPU组合的混合架构,它们对某些特殊问题,譬如基于FFT的图像处理或N体颗粒计算等领域可获得很高的性能。但是对由有限差分(或基于网格的有限元)离散的偏微分方程问题,于CPU/GPU集群上获得较好的性能仍然是一种挑战。本文提出并测试一种基于这类集群架构的混合算法。算法的可扩展性通过区域分解算法实现,而GPU的性能由基于光滑聚集的代数多重网格法获得,避免了在GPU上表现不理想的不完全分解算法。本文的数值实验采用32CPU/GPU求解用差分离散后达三千万未知数的偏微分方程。  相似文献   

16.
【目的】高超声速湍流直接数值模拟(DNS)对空间及时间分辨率要求高,计算量非常大。过大的计算量及过长的计算时间是导致DNS难以在工程中被大范围应用的重要原因。为加快计算速度,作者设计并开发了一套CPU/GPU异构系统架构(HSA)下的高性能计算流体力学程序OpenCFD-SCU。【方法】该程序以作者前期开发的高精度有限差分求解器OpenCFD-SC为基础,经GPU系统的移植及优化而得。GPU程序的计算部分使用CUDA编程,确保所有算术运算都在GPU上完成。【结果】利用GPU程序OpenCFD-SCU,进行了来流Mach数6,6°攻角钝锥边界层转捩的直接数值模拟,得到了转捩过程中的时空演化流场。针对这一算例,GPU程序OpenCFD-SCU与CPU程序OpenCFD-SC相比,实现了60倍的加速效果(单GPU卡对单CPU核心),大大加速了DNS计算过程。【结论】未来,相信会有更多高超声速湍流模拟选择在GPU上开展。  相似文献   

17.
为有效提高异构的CPU/GPU集群计算性能,提出一种支持异构集群的CPU与GPU协同计算的两级动态调度算法。根据各节点计算能力评测结果和任务请求动态分发数据,在节点内CPU和GPU之间动态调度任务,使用数据缓存和数据处理双队列机制,提高异构集群的传输和处理效率。该算法实现了集群各节点"能者多劳",避免了单节点性能瓶颈造成的任务长尾现象。实验结果表明,该算法较传统MPI/GPU并行计算性能提高了11倍。  相似文献   

18.
CPU/GPU异构系统具有很大的发展潜力,深入研究CPU/GPU异构平台的并行优化,可实现系统整体计算能力的最大化。通过对CPU/GPU任务划分的优化来平衡CPU和GPU的负载,可提高计算资源的利用率,缩短计算任务的执行时间;通过对GPU线程划分的优化,可使GPU获得更高的速度。从而提高系统整体性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号