期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

贾伟乐曹宗雁王龙迟学斌高卫国汪林望《计算机科学与探索》2014,(7):769-777

基于平面波的第一原理计算方法是目前材料科学中最常用的方法,但传统的CPU并行计算遇到可扩展性瓶颈,无法改善其求解的绝对速度。系统地介绍了利用图形处理器（graphic processing unit,GPU）加速技术开发的大规模第一原理材料计算软件：Ultra-Mat。该软件对第一原理平面波算法进行了系统的算法设计和软件实现：（1）通过采用并行方案,实现了快速傅里叶变换（fast Fourier transform,FFT）的GPU局部操作;（2）设计了基于数据压缩的混合精度算法,显著减少了电子结构计算部分的MPI（message passing interface）通信;（3）完成了逾90%代码的GPU实现,目的是最大限度地减少中间流程,以避免CPU-GPU切换引发的数据传输,这是GPU应用中公认的性能瓶颈。测试结果显示Ultra-Mat具有很好的计算性能,对于512原子的GaAs系统,在电子结构计算部分,使用256 GPU卡相比4096 CPU核心有18倍的加速。相似文献

2.

GPU加速在第一性原理输运研究中的应用

郑小宏兰杰郝华曾雉《数据与计算发展前沿》2013,4(5):90-96

分子器件中的第一性原理输运计算比普通的密度泛函计算要慢很多,其最根本原因在于密度矩阵计算方法的不同。本文将 GPU 加速应用于第一性原理的输运计算,重点实现相关矩阵运算的加速。测试结果表明,在单次迭代中,对于较大的体系,相对于调用 MKL 库,密度矩阵的运算速度在单个 Tesla M2090 可以提高一个数量级以上,在 Tesla K20m 上则可以提高 20 倍以上,从而取得了很好的加速效果,而且体系越大,加速效果越好。相似文献

3.

氧气在LaMnO₃（001）表面吸附的第一性原理研究

闫志国王会杨小俊袁华吴元欣《计算机与应用化学》2012,29(3):287-290

本文采用从头计算密度泛函平面波赝势方法,系统研究了氧气在LaMnO₃（001）表面吸附过程。研究结果表明:整个过程属于化学吸附;Pauling、Griffiths以及双中心吸附模式为较优吸附模式;吸附过程中形成了O₂^-;吸附后表面Mn的化合价均有不同程度的升高,其中Griffiths吸附模式下Mn的化合价变化最多,分别为:Mn^3+0.87、Mn^3+0.85,有利于催化剂活性组分Pd⁰-Pd²的转化。相似文献

4.

超软赝势密度泛函分子动力学计算中的若干优化算法

高岩涛贾伟乐王龙汪林望《数据与计算发展前沿》2015,6(4):47-53

基于密度泛函理论的第一性原理计算是科学计算中重要的领域,被广泛用于材料计算和量子化学等研究。我们在PEtot软件的基础上研发了GPU加速软件PWMat,本文主要介绍:1)针对超软赝势密度泛函算法部分的GPU算法优化与实现,取得了2-3倍的加速;2)针对超软赝势密度泛函分子动力学计算部分的若干算法优化,包括原子受力求解算法的修正、电荷密度和波函数的插值算法的改进等。其中原子受力的收敛精度获得了1-2个数量级的提高,电荷密度的收敛精度获得了2-4个数量级的提高。相似文献

5.

基于非局部均值的多尺度色调映射

下载免费PDF全文

芦碧波李祎《计算机工程与应用》2013,49(16):162-164

针对高动态范围图像在传统输出设备上的显示问题,给出一个基于非局部均值滤波的多尺度色调映射算法。该算法使用非局部均值滤波对高动态范围图像进行粗化,将图像分解为一个包含大尺度变化的基本层和多个具有小尺度特征的细节层,对基本层和细节层分别进行调整,进行色彩还原。实验结果表明,与双边滤波等算法相比,该算法在较好还原真实场景的同时,不仅避免了光晕现象,也保留更丰富的细节信息。相似文献

6.

固溶合金第一性原理计算方法初探

徐黎闽杨真方俊高兴誉宋海峰《数值计算与计算机应用》2021,(1):18-32

固溶合金第一性原理计算在新型合金物性研究与合金组分优化设计中扮演着重要角色.固溶合金具有化学无序结构,晶格平移对称性破缺,难以直接应用标准的第一性原理计算方法.本文介绍了确定组分固溶合金第一性原理计算的主要两类方法.第一类方法是相干势近似方法,我们推导了相干势近似的自洽方程,基于多重散射理论梳理了单格点杂质系统Green函数的计算方法.第二类方法是超胞结构建模方法,我们介绍了相似原子环境的数学模型,推导了整体化学无序与短程化学有序的统一描述方法,证明了两种超胞结构建模方法最优解之间的关系.结合第一性原理计算与热力学模型,我们应用这两类方法预测了变组分铀铌合金的晶格参数与典型镁铝合金的热力学物性,获得了实验验证. 相似文献

7.

基于“AI+HPC”的第一原理计算时间预测及其在社区平台中的应用

李治莹马硕周超马英晋刘倩金钟《计算机科学》2022,(10):36-43

密度泛函方法在常用的第一原理计算方法中有着计算标度低、计算精度高的特点,因此其在化学、生物、医药等领域得到了越来越广泛的应用。然而,在实际应用中,其较为高昂的计算代价对用户计算参数的决策以及计算中心的作业分配都提出了新的挑战。近期开发的基于机器学习的密度泛函计算时间预测系统,能够在算前预测实际的计算开销,预测结果的平均相对误差一般小于0.15,符合实际计算场景下的预测精度要求。文中进一步推进和完善了该预测系统,提供了多GPU并行计算功能、机器学习模型的模块化增补;将其与生物医药社区相结合,实现了对平台计算任务的实时机时显示,方便用户统筹;并基于此开发了智能负载均衡模块,可以提高超大分子及团簇体系的第一性原理并行计算效率。通过多个方面的推进,改善了预测系统的实用性,并在社区平台和并行计算方面得到了初步应用。相似文献

8.

Hierarchical parallel processing of large scale data clustering on a PC cluster with GPU co-processing

Hiroyuki Takizawa Hiroaki Kobayashi 《The Journal of supercomputing》2006,36(3):219-234

This paper presents an effective scheme for clustering a huge data set using a PC cluster system, in which each PC is equipped with a commodity programmable graphics processing unit (GPU). The proposed scheme is devised to achieve three-level hierarchical parallel processing of massive data clustering. The divide-and-conquer approach to parallel data clustering is employed to perform the coarse-grain parallel processing by multiple PCs with a message passing mechanism. By taking advantage of the GPU’s parallel processing capability, moreover, the proposed scheme can exploit two types of the fine-grain data parallelism at the different levels in the nearest neighbor search, which is the most computationally-intensive part of the data-clustering process. The performance of our scheme is discussed in comparison with that of the implementation entirely running on CPU. Experimental results clearly show that the proposed hierarchial parallel processing can remarkably accelerate the data clustering task. Especially, GPU co-processing is quite effective to improve the computational efficiency of parallel data clustering on a PC cluster. Although data-transfer from GPU to CPU is generally costly, acceleration by GPU co-processing is significant to save the total execution time of data-clustering. 相似文献

9.

基于GPU的低密度奇偶校验码译码加速技术

徐启迪刘争红郑霖《计算机应用》2022,42(12):3841-3846

随着通信技术的发展,通信终端逐渐采用软件的方式来兼容多种通信制式和协议。针对以计算机中央处理器（CPU）作为运算单元的传统软件无线电架构,无法满足高速无线通信系统如多进多出（MIMO）等宽带数据的吞吐率要求问题,提出了一种基于图形处理器（GPU）的低密度奇偶校验（LDPC）码译码器的加速方法。首先,根据GPU并行加速异构计算在GNU Radio 4G/5G物理层信号处理模块中的加速表现的理论分析,采用了并行效率更高的分层归一化最小和（LNMS）算法;其次,通过使用全局同步策略、合理分配GPU内存空间以及流并行机制等方法减少了译码器的译码时延,同时配合GPU多线程并行技术对LDPC码的译码流程进行了并行优化;最后,在软件无线电平台上对提出的GPU加速译码器进行了实现与验证,并分析了该并行译码器的误码率性能和加速性能的瓶颈。实验结果表明,与传统的CPU串行码处理方式相比,CPU+GPU异构平台对LDPC码的译码速率可提升至原来的200倍左右,译码器的吞吐量可以达到1 Gb/s以上,特别是在大规模数据的情况下对传统译码器的译码性有着较大的提升。相似文献

10.

7-氨基-3-去乙酰基头孢烷酸的密度泛函研究 总被引：4，自引：4，他引：0

屈一新张超《计算机与应用化学》2004,21(2):275-282

为了确定STO-3G、3-21G、6．31G三个基组是否适用于7-氨基-3-去乙酰基头孢烷酸(简称7-ADCA),以及计算其热力学函数,本文用密度泛函理论的B3LYP方法分别在STO一3G、3-21G、6—31G水平上对7一ADcA进行红外光谱计算、能量计算和结构优化。将得到的三组红外光谱波数与实验值进行比较分析,发现3—21G和6—31G基组得到的数据比较可靠。得到的能量参数用于计算7一ADCA的一些热力学函数,例如标准生成热、生成吉布斯自由能和标准熵,并对结果进行校正。比较三个基组优化出的7-ADCA的结构,发现3—21G和6—31G基组得到的结果相近,而与STO．G相比有一些出入。这些分析结果有助于7-ADCA合成头孢药物的研究。相似文献