首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   4篇
  免费   0篇
  国内免费   1篇
综合类   1篇
机械仪表   1篇
建筑科学   1篇
无线电   1篇
自动化技术   1篇
  2022年   1篇
  2018年   1篇
  2012年   1篇
  2011年   1篇
  2010年   1篇
排序方式: 共有5条查询结果,搜索用时 62 毫秒
1
1.
基于GPU的稀疏矩阵向量乘优化   总被引:1,自引:0,他引:1  
针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法.这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取.实验分析表明,提出的各种手段起到了优化的作用.与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上.  相似文献   
2.
压力分散型预应力锚索是一种新型锚索,在各项工程中得到了广泛的应用。使用这种锚固方式可以将荷载分散传送到钻孔中各个不同位置的固定段,而且可以避免应力集中的情况,从而防止粘结效应出现脱开或弱化的情况。本文以轨道交通工程为实例,对压力分散型锚索施工技术进行了分析和探讨,值得类似工程借鉴和参考。  相似文献   
3.
基于GPU的混合精度平方根共轭梯度算法   总被引:1,自引:0,他引:1  
针对当前基于GPU的数值算法具有双精度数据性能低下的缺陷.提出了一种适于GPU统一计算架构Fermi-CUDA的混合精度平方根共轭梯度算法用以求解稀疏线性方程组.该算法采用单精度内迭代与双精度外迭代结合的方法,以充分利用GPU体系结构下单精度高性能和双精度高精度的优点.整个算法的计算部分完全在GPU端进行,减少了CPU和GPU之间的数据通信.实现了基于GPU的平方根共轭梯度法、Jacobi迭代法和Gauss-Seidel迭代法,分析它们作为内迭代算子对算法收敛性的影响.实验表明,该算法获得了与全双精度数据处理等同的计算精度,比GPU全双精度在浮点性能上提升近一倍,相对于CPU全双精度串行算法,最大加速比达到70以上.  相似文献   
4.
基于GPU的共享信息素矩阵多蚁群算法   总被引:1,自引:0,他引:1  
在研究并行蚁群信息素交流方法的基础上,提出了一种适于GPU统一计算架构模型的多蚁群算法。采用多个同构和异构蚁群共享同一信息素矩阵的交流策略,解决信息素多样性和算法性能之间的矛盾。在路径探索阶段,多只获得迭代最优解且差异较大的蚂蚁共同释放信息素,以利群体多样性;在路径开发阶段,获得唯一全局最优解的蚂蚁释放信息素,以利迅速收敛。多蚁群映射到GPU的线程块而群内蚂蚁对应块内多线程。以MMAS和ACS混合为例给出了该策略下信息素初始化和动态界限的新方法,证明了算法是值收敛和解收敛的。在标准TSP问题实例上的实验评测表明,该算法不仅提升了性能,在充分收敛条件下获得了更高质量的解。  相似文献   
5.
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号