首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   1篇
  免费   0篇
  国内免费   1篇
金属工艺   1篇
自动化技术   1篇
  2024年   1篇
  2019年   1篇
排序方式: 共有2条查询结果,搜索用时 15 毫秒
1
1.
BLAS (basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外, BLAS 3级属于计算密集型函数,对充分发挥处理器的计算性能有至关重要的作用.针对国产SW26010-Pro处理器研究BLAS 3级函数的众核并行优化技术.具体而言,根据SW26010-Pro的存储层次结构,设计多级分块算法,挖掘矩阵运算的并行性.在此基础上,基于远程内存访问(remote memory access, RMA)机制设计数据共享策略,提高从核间的数据传输效率.进一步地,采用三缓冲、参数调优等方法对算法进行全面优化,隐藏直接内存访问(direct memory access, DMA)访存开销和RMA通信开销.此外,利用SW26010-Pro的两条硬件流水线和若干向量化计算/访存指令,还对BLAS 3级函数的矩阵-矩阵乘法、矩阵方程组求解、矩阵转置操作等若干运算进行手工汇编优化,提高了函数的浮点计算效率.实验结果显示,所提出的并行优化技术...  相似文献   
2.
针对齿轮箱复合故障振动信号的非稳定性和多分量耦合调制的复杂特性,提出了基于分段三次Hermit插值改进的LMD与切片双谱相结合的复合故障特征提取方法,结合分段三次Hermit插值法稳定性好且能保证每个小段连续光滑的优点,用分段三次Hermit插值法代替滑动平均法,对极值点构造局部均值函数和包络估计函数,减少了信号的包络误差,提高了LMD分解的精确度。并以齿轮箱中滚动轴承和齿轮的复合故障振动信号为研究对象,通过实验对比验证了改进LMD的优越性和本文所提方法对复合故障诊断的有效性。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号