期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机辅助设计与图形学学报》2014,(1)

针对当前光子衍射效果绘制方法的真实感问题,提出应用微表面模型的衍射效果物理绘制方法.该方法融合了现有衍射绘制模型中的特点,并结合特定材质的可变菲涅尔系数来增强衍射效果;通过综合考虑微表面对光子的吸收、遮挡、再反射等交互场景,扩展了高度场微表面的适用范围;引入维格纳分布函数推迟衍射效果,以进一步增强微表面模型;利用蒙特卡罗采样理论求解波动方程积分式以降低计算复杂度,辅以几何光线追踪理论,求取微表面辐射度空间分布;最终以光的波动方程为基础,构建了可应用于光线追踪器的双向反射分布函数衍射光学模型.实验结果表明,该模型能够有效地模拟波的相位与幅值信息,可绘制出较为逼真的衍射效果. 相似文献

2.

基于CUDA的快速图像压缩 总被引：1，自引：0，他引：1

郭静陈庆奎《计算机工程与设计》2010,31(14)

为了进一步提高JPEG编码效率,对JPEG压缩算法进行研究,分析得出JPEG核心步骤可以并行化处理.因此,实现平台宜采用以并行计算为优势的GPU,而不是以串行计算为主的CPU.NVIDIA新推出的CUDA(计算统一设备架构)为此实现提供了软硬件环境.CUDA是基于GPU进行通用计算的开发平台,非常适合大规模的并行数据计算.在GPU流处理器架构下用CUDA技术实现编码并行化,并针对流处理器架构特点进行内存读写等方面的优化,提高了JPEG编码的速度.实验结果表明了CUDA技术在并行处理方面的优越性,JPEG编码效率得到了极大提高. 相似文献

3.

基于CUDA的加速MATLAB计算研究* 总被引：3，自引：1，他引：3

刘绍波刘明贵张国华《计算机应用研究》2010,27(6):2140-2143

介绍了NVIDIA公司新的编程框架CUDA的特点以及CUDA加速MATLAB的方法,测试了CUDA加速岩土工程中常用的算法如矩阵计算、快速傅里叶变换、支持向量机。随后分析了数据规模、算法复杂性与加速效果的关系,指出了基于CUDA的MATLAB加速计算的应用前景。测试结果表明,CUDA方式相对传统计算方式的最好加速效果分别达到了22.39倍、46.88倍、51.32倍,证明了CUDA加速计算的有效性。相似文献

4.

基于嵌入式平台双目测量的CUDA优化

尚裕之韩军陈方杰王祖武《计算机工程与设计》2019,40(3)

相似文献

5.

基于CUDA的快速大整数乘法

下载免费PDF全文

许亮王震《计算机工程与应用》2013,49(16):221-224

针对快速傅里叶变换下的快速大整数乘法,给出了一种基于CUDA架构的GPU并行化加速的实现方法。通过分析整数快速乘法中的每一步骤,分别给出各步骤的并行化实现方法,并采用数据压缩等策略,对算法进行优化。实验表明该方法有效地提高了算法效率,随着数据规模的增长,可获得18倍以上的加速比。相似文献

6.

基于CUDA的地震倾角方位角并行算法

陈鹏程向伟铭张全《计算机应用》2019,39(z2)

相似文献

7.

卡尔曼滤波语音增强算法的CUDA实现 总被引：1，自引：0，他引：1

苏洁洪李宇《自动化与信息工程》2014,(5):31-34

提出一种卡尔曼滤波语音增强算法的统一计算设备架构并行实现方案。该方案通过离散余弦变换把含噪语音分解为不相关的DCT系数,使原来的时域串行处理转化为统一计算设备架构并行处理,只需较少的线性预测阶数,节省运算时间。实验结果表明:与时域卡尔曼滤波比较,该方法有更高的输出分段信噪比,其统一计算设备架构加速方案可有效缩短语音增强运算的时间。相似文献

8.

基于CUDA的尺度不变特征变换快速算法

下载免费PDF全文

田文徐帆王宏远周波《计算机工程》2010,36(8):219-221

针对尺度不变特征变换(SIFT)算法耗时多限制其应用范围的缺点,提出一种基于统一计算设备架构(CUDA)的尺度不变特征变换快速算法,分析其并行特性,在图像处理单元(GPU)的线程和内存模型方面对算法进行优化。实验证明,相对于CPU,算法速度提升了30~50倍,对640×480图像的处理速度达到每秒24帧,满足实时应用的需求。相似文献

9.

基于CUDA的GMM模型快速训练方法及应用 总被引：1，自引：1，他引：0

吴奎宋彦戴礼荣《数据采集与处理》2012,27(1):85-90

由于能够很好地近似描述任何分布,混合高斯模型(GMM)在模式在识别领域得到了广泛的应用.GMM模型参数通常使用迭代的期望最大化(EM)算法训练获得,当训练数据量非常庞大及模型混合数很大时,需要花费很长的训练时间.NVIDIA公司推出的统一计算设备架构(Computed unified device architecture,CUDA)技术通过在图形处理单元(GPU)并发执行多个线程能够实现大规模并行快速计算.本文提出一种基于CUDA,适用于特大数据量的GMM模型快速训练方法,包括用于模型初始化的K-means算法的快速实现方法,以及用于模型参数估计的EM算法的快速实现方法.文中还将这种训练方法应用到语种GMM模型训练中.实验结果表明,与Intel DualCore PentiumⅣ3.0 GHz CPU的一个单核相比,在NVIDIA GTS250 GPU上语种GMM模型训练速度提高了26倍左右. 相似文献

10.

CUDA平台下的实时超声扫描转换

王伟民王合闯王华军《计算机应用》2011,31(10):2760-2763

为了克服传统医学超声扫描转换不能实时的缺陷,实时超声扫描转换算法利用计算统一设备架构(CUDA)技术,通过分配最优的线程结构、合理规划中央处理器(CPU)和图形处理器(GPU)之间的数据传输方式和计算任务的划分,提高了算法的吞吐量,满足了实时性。传统CPU算法和3种GPU算法的实验结果对比显示,GPU处理3121×936大小的图片,帧速率可达746fps,并行算法加速比可达300以上。相似文献

11.

基于CUDA粒子系统的烟花仿真

陈修亮梁英杰郭福亮《计算机应用》2013,33(7):2059-2062

粒子系统的基本理论符合自然世界的客观规律,适用于烟花等复杂现象的仿真。针对粒子系统仿真存在的计算和内存资源消耗巨大等问题,建立了基于统一计算设备架构(CUDA)框架的粒子系统基本模型,讨论了模型中粒子的存储与运动更新,研究了基于CUDA的并行KD-TRIE邻近粒子搜索算法。运用建立的CUDA粒子系统,研究了烟花仿真的具体实现。仿真结果表明,系统能够较逼真地仿真烟花的上升与绽放过程,帧率高达每秒312帧,仿真的真实感和实时性得到增强。相似文献

12.

分子动力学模拟软件GROMACS向GPGPU移植初探

严历郭力李晓霞《计算机与应用化学》2010,27(12)

GROMACS是著名分子动力学模拟软件之一,GPGPU技术能够使用图形处理器完成通用计算,是高性能计算的最新发展趋势.本文通过对Nvidia CUDAGPGPU编程模式以及GROMACS代码的研究分析,论证了将GROMACS移植到以GPGPU为计算核心的平台上的可行性,并通过算法和参数数据组织形式的改造实现了GROMACS中非键力计算函数从x86处理器向GPGPU的移植,获得显著的性能提升,计算加速比达到10倍以上,为GROMACS整体移植的实现奠定了基础. 相似文献

13.

基于GIS的城市电磁环境仿真平台实现

曾国奇李思吟韦志棉《电子技术应用》2012,38(9):134-137

针对城市电磁环境的特点,根据各种电磁波传播模型的适用环境,选择合适的模型并加以改进,精确地计算出给定条件下的城市电磁场强度分布。通过Visual C++6.0编程并利用GIS控件在城市三维地图绘制电磁场强度分布图,实现了城市电磁环境监测系统仿真平台,为电磁污染的防护和治理提供依据和指导。相似文献

14.

基于国产平台的非易失功能模拟方法

李欣泽孙大东濮约刚马帅《计算机工程与设计》2022,43(2):488-494

为满足工程实践中对非易失内存的需求,在不对自主通用服务器主板进行重新设计修改的前提下,设计并实现一种基于软件模拟方法.通过修改操作系统内核以及驱动,将普通的易失性内存模拟为非易失内存,实现关机时数据保存以及开机时数据恢复功能.通过与NVDIMM-N非易失内存在执行时间以及读写性能方面进行对比,采用该模拟方法达到的效果整... 相似文献

15.

CUDA平台下LISP2算法垃圾收集并行研究

下载免费PDF全文

张聪品吴长茂赵理莉《计算机工程与应用》2010,46(33):75-77

为了提高垃圾收集效率,降低垃圾收集耗费时间,提出一种基于LISP2算法的并行节点复制垃圾收集算法,给出了在CUDA环境下该算法的实现。实验结果显示,该算法在CUDA环境下能有效提高垃圾收集效率。相似文献

16.

基于CUDA的图像匹配算法

周冰园陈庆奎高丽萍秦川《计算机工程与应用》2015,51(12):165-170

为解决目前已有的图像匹配算法不适用于对实时性要求很强的应用,提出了PLS（Partial Least Squares）与余弦定理相结合的并行化图像匹配算法。该算法在CUDA架构下,对图像矩阵分块,分块后每个小块图像存入共享存储器处理并提取每个小块图像特征,通过合并后图像特征采用余弦定理计算图像的相似度,从而找出匹配图像。实验表明,CUDA架构下可以实现图像的并行匹配,与CPU上串行匹配相比,时效性提高了百倍以上。相似文献

17.

基于CUDA的拉普拉斯金字塔的优化

《微型机与应用》2016,(10):40-42

提出了基于CUDA的并行拉普拉斯金字塔算法。算法采用的并行拉普拉斯算法很好地解决了共享存储器的bank冲突和全局存储器的合并访问的问题,为了最大化并行效率,计算了SM占用率,并通过公式进行了论证。在GTX480平台下,基于CUDA的并行拉普拉斯金字塔算法获得了几十倍的加速比。最后,将基于CUDA的并行拉普拉斯金字塔算法成功地应用于图像融合和增强图片的细节处理,充分证明了并行拉普拉斯金字塔算法广泛的有效性和必要性。相似文献

18.

基于VMware技术的Linux仿真实验平台构建

徐建华《计算机时代》2013,(10)

针对Linux课程实验条件存在的问题,在分析虚拟机技术的基础上,结合Linux课程的教学目标,实现了基于VMware技术的Linux仿真实验系统.在该仿真系统上可以完成各类Linux实验,方便做到教、学、做合一,为提高教学质量提供有力保障. 相似文献

19.

基于Eclipse平台的导航仿真系统集成

苏年乐王晓双李群王维平《计算机应用》2008,28(3):779-781

针对卫星导航仿真系统的软件集成需求,提出了基于Eclipse集成该系统各实验任务的解决方案。通过开发Eclipse新建实验向导插件、实验配置插件、实验分析插件,有效集成了导航仿真系统的各个实验任务模块,为实验分析人员提供一个具有统一界面和操作风格的系统软件。借助Eclipse平台自身的优势,该集成方法具有开发时间短、开发成本低的优点。此集成方法还具有开放性的特点,未来开发的实验任务模块也可集成到现有的系统中。相似文献