期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	14篇
免费	3篇
国内免费	1篇

专业分类

一般工业技术	1篇
自动化技术	17篇

出版年

2019年	3篇
2018年	2篇
2016年	1篇
2015年	2篇
2014年	2篇
2013年	1篇
2010年	2篇
2009年	3篇
2008年	2篇

排序方式： 共有18条查询结果，搜索用时 15 毫秒

1 [2] 下一页 » 末页»

一种基于FPGA的素域椭圆曲线标量乘结构

邬贵明王淼谢向辉《计算机工程与科学》2018,40(5):793-797

基于一种简化求商的高基Montgomery模乘流水化阵列结构,提出并实现了素域上椭圆曲线标量乘硬件结构。该结构采用修正的Jacobian坐标的点加和倍点算法以及Kaliski提出的Montgomery模逆的算法。实验结果表明,该结构与相关工作相比具有更好的性能。相似文献

模型驱动的开发异构多核多级并行的方法

王淼邬贵明漆锋滨《计算机工程与应用》2013,49(3):34-39

将异构多核处理器的资源分配问题抽象为一个三维优化空间,空间中的每个元素对应多任务程序的一个并行策略,确定程序有效并行策略的问题转化为优化空间的搜索问题。为了加速搜索,提出一种基于遗传算法的智能搜索方法。实验表明,模型驱动的并行策略选择方法能够在极短的时间内为程序生成较好的并行策略。相似文献

GF(2m)上椭圆曲线标量乘的硬件结构实现

邬贵明郑方谢向辉吴东严忻恺《计算机科学》2015,42(1):79-81,89

基于Reyhani Masoleh提出的GF(2m)高斯正规基乘法实现了三拍非流水的正规基乘法器,并基于该乘法器实现了一种高性能López-Dahab标量乘硬件结构.Reyhani-Masoleh算法利用乘法矩阵的对称性降低了乘法的复杂度;而López-Dahab标量乘算法由于采用投影坐标,计算速度快且可以有效降低存储需求.基于Reyhani-Masoleh乘法器的López-Dahab标量乘结构可以有效利用两种算法的优势,可以达到目前最好的标量乘硬件结构的性能. 相似文献

面向定制结构的稀疏矩阵分块方法

邬贵明王淼谢向辉窦勇郭松《计算机科学》2015,42(11):63-64, 79

稀疏矩阵向量乘是科学计算的核心问题,采用定制结构来加速稀疏矩阵向量乘的执行对提升科学计算性能具有重要意义。针对目前面向定制结构的稀疏矩阵分块方法和表示方法的缺点,提出了稀疏矩阵二维均匀分块方法和相应的表示方法嵌套分块CSR。实验结果表明,提出的稀疏矩阵分块方法和表示方法能够有效减少填零个数。相似文献

面向高性能计算的众核处理器结构级高能效技术 总被引：1，自引：0，他引：1

郑方张昆邬贵明高红光唐勇吕晖过锋李宏亮谢向辉《计算机学报》2014,37(10)

随着半导体技术的进步,众核处理器已经广泛应用于高性能计算领域.而要构建未来高性能计算系统,处理器必须突破严峻的"能耗墙"挑战.文中以一款自主众核处理器DFMC原型为基础,首先对其在典型负载下的能耗分布进行了分析,结合该处理器的具体结构,提出了基于指令窗口的指令缓冲、操作数锁存两种结构级能效优化技术,探索了能效优先的浮点部件设计方法.实验表明,通过上述技术可以降低处理器取指和译码能耗约50%、寄存器文件能耗11.2%和浮点部件能耗17.6%,最终全芯片降低能耗约14.7%.在该文所述实验环境下,作者还进行了DFMC原型的双精度矩阵乘(DGEMM)性能功耗比测试,并与NVIDIA公司的Kepler K20GPU进行了对比. 相似文献

一个面向异构多核处理器Cell的资源分配模型

王淼王志英邬贵明《高技术通讯》2010,20(12)

为了充分利用多核处理器提供的多级并行和解决多核资源分配问题,提出了一种将多任务并行程序映射到多核处理器平台上的模型驱动的方法。该方法首先创建一个三维优化空间来表示资源分配配置,而后通过搜索该空间为应用生成多种并行机制,最后对各种并行机制进行静态评估从而找出最优的机制。该方法同时考虑了任务并行、数据并行以及通讯开销。在异构多核处理器Cell上利用一个图像处理应用对此方法进行了测试。实验表明,这种模型驱动的方法能够很好地评估性能并为应用确定有效的并行机制。相似文献

高基Montgomery模乘阵列结构设计与实现

邬贵明谢向辉吴东郑方严忻恺《计算机工程与科学》2014,36(2):201-205

提出了两种高基Montgomery模乘线性阵列结构。两种线性阵列结构分别利用两种不同的并行化开发方法，沿不同的循环维度进行任务分配和调度，都能够充分开发算法的流水线并行。在Xilinx XC5VLX330 FPGA上实现了两种256位宽、基为216的模乘阵列结构。实验结果表明，两种结构具有84个时钟周期的延迟，吞吐率分别为1/17和1/21，与相关结构相比吞吐率更高。两种结构在性能和实现代价间能够达到合理平衡。相似文献

FPGA应用于高性能计算的研究现状和未来挑战

贾迅钱磊邬贵明吴东谢向辉《计算机科学》2019,46(11)

相似文献

大规模三角线性方程的高效求解

贾迅邬贵明钱磊谢向辉吴东《计算机工程与科学》2019,41(2):240-245

大规模三角线性方程求解是科学与工程应用中重要的计算核心,受限于处理器的缓存容量和结构设计,其在CPU和GPU等平台上的计算效率不高。大规模三角线性方程的分块求解中,矩阵乘是主要运算,其计算效率对提升三角线性方程求解的计算效率至关重要。以矩阵乘计算效率较高的矩阵乘协处理器为计算平台,针对其结构特点提出了矩阵乘协处理器上大规模三角线性方程分块求解的实现方法和性能分析模型。实验结果表明,矩阵乘协处理器上大规模三角线性方程求解的计算效率最高可达85.9%,其实际性能和资源利用率分别为同等工艺下GPU的2.42倍和10.72倍。相似文献

10.

二维DCT在粗粒度可重构处理器上的实现

下载免费PDF全文

徐佳庆邬贵明窦勇《计算机工程》2008,34(20):257-259

针对粗粒度可重构处理器的特点,提出一种二维离散余弦变换的设计方法,该方法在硬件资源受限的条件下,有效地挖掘了算法的并行性,结果证明算法在速度和资源利用率方面均达到了较好的状态,可满足实时图像编解码的要求。相似文献

1 [2] 下一页 » 末页»