共查询到20条相似文献,搜索用时 156 毫秒
1.
SIMD处理机特别适合于要求大量高速向量或矩阵计算的场合,数据缓存系统和对准网络是它的关键部件。而图像卷积是图像处理技术中最基本也是最重要的一项技术,文章根据数字图像的卷积定理对数字图像的卷积运算进行了分析,在此基础上提出了一种基于SIMD处理机的可变卷积模板的图像卷积处理器的体系结构。该处理器内部包含有接口部件、控制部件、数据缓存系统、对准电路和执行部件等。它的极高效率的数据缓存系统和对准电路成为该处理器最有特色的部分,它从根本上解决了图像卷积中的数据复用带来的CPU重复访问主存储器的问题。实现了3×3、5×5、7×7、9×9、11×11、13×13和15×15卷积模板的图像卷积运算的变换而无需另行更改硬件电路的特点。最后,对这个图像卷积处理器体系结构的性能进行了缜密的分析。 相似文献
2.
为了对我国自主研发的龙芯2号处理器的性能进行评价,获取龙芯2号处理器性能的客观数据。提出一种针对龙芯2号处理器的采用由国际标准性能评测组织开发的、专门用于评价CPU性能的SPEC CPU2000测试程序的测试和分析的方法。该方法包括在Linux操作系统下安装和配置SPEC 2000程序的要点和使用SPEC 2000程序对龙芯2E处理器进行性能测试的具体流程,还包括对SPEC 2000程序运行结果的分析。目前该方法已经应用,效果良好。 相似文献
3.
文章介绍了龙芯处理器3A5000内置硬件加密模块,支持商用密码SM2/3/4,通过搭建测试环境,对龙芯3A5000处理器运算SM2/3/4算法的速度和吞吐量进行了测试,并与其他8款市面上主流的处理器进行了比较;对测试结果进行了分析,根据英特尔CPU的指令集机制进行了估算,与上一代处理器进行了对比,并对下一代处理器进行了展望。 相似文献
4.
多核已经成为通用处理器设计技术的最重要发展方向。由于多核芯片内具有多个处理蠡核,芯片的缓存结构、线程调度等与传统CPU有很大的区别,本文探讨了多核芯片的基本结构特征,并基于指令集级系统仿真工具Simics建立了多核CPU模拟环境用于进行分析。 相似文献
5.
6.
《现代电子技术》2016,(16):83-87
针对多核处理器的特点提出一种新型的异构多核DSP处理器结构。主处理器为通用处理器,作为控制密集型处理器核用于系统管理和控制;8个DSP作为计算密集型处理器核,用于大信息量融合计算。详细设计8个DSP之间的No C互连结构。首先采用2×4 2D Turos结构进行单个路由节点结构的设计,包括数据包格式、路由和仲裁设计;其次对路由节点进行编码、路由算法设计和确定节点路由方向。该结构具有总线局部通信带宽高的优点,采用No C的易扩展性和No C在各DSP之间通信的并行性使系统规模易于扩展并满足大批量数据传输要求。最后通过仿真实验,验证了该设计的有效性,为后续多核处理器的设计与实现打下坚实的技术基础。 相似文献
7.
给出了一种采用MIPS指令集的64核处理器Tilepro64作为硬件平台,实现了可以达到亚毫秒级处理时延的云计算基础架构作为基带信号处理和关键应用的支撑平台,实现了在多核处理器上的运算并行优化、动态平衡负载、时延保证、服务注册机制的设计和实现。相对于x86通用处理器,该云计算平台功耗低、密度高、能效比高;相对于专用硬件,开发成本低、周期短。 相似文献
8.
在今年上半年深圳举办的"第一届中国高端芯片高峰论坛"的"高端处理器发展战略研讨"上,龙芯、飞腾和兆芯介绍了其CPU发展思路、战略及产品. 相似文献
10.
11.
To overcome the limitations of the existing brute force cracking method of Wi‐Fi Protected Access/Wi‐Fi Protected Access II (WPA/WPA2)‐pre‐shared key (PSK) based on single core CPU or one core of a multi‐core CPU, a new distributed multi‐core CPU and GPU parallel cracking method (DMCG) was first proposed. Colored Petri nets was used to validate the four‐way handshake protocol and proved that DMCG could successfully crack WPA/WPA2‐PSK. In DMCG, the PSK list was distributed to each PC reasonably using distributed technology. Multiple computing cores were made up of multi‐core CPU and GPU on single PC to crack in parallel. GPU contributed to the cracking speed improvement due to the strong computing power for intensive parallel tasks. Experimental results showed that DMCG improved the cracking speed by two orders of magnitude and would exhibit more notable advantages with high‐performance distributed system as the cracking speed improved by three or four orders of magnitude, compared with the computing power of one CPU core. An improved Amdahl's law was first proposed, by which the upper bound of the cracking speedup was analyzed. Aiming to the DMCG expansion of cloud computing based on GPU, a lightweight framework called Dandelion computing model was first proposed. Moreover, the analysis of the influences of the graphics card parameters on the cracking speed was processed, and accordingly, the decision support for choosing graphics card in DMCG based on analytic hierarchy process was provided. Finally, the performance optimization of DMCG was processed. Copyright © 2013 John Wiley & Sons, Ltd. 相似文献
12.
13.
14.
以可信计算技术为基础,针对可信云平台构建过程中可信节点动态管理存在的性能瓶颈问题,提出了基于TPM联盟的可信云平台体系结构及管理模型。针对TPM自身能力的局限性,提出了宏TPM和根TPM的概念。针对可信云中节点管理时间开销大的问题,引入时间树的概念组织TPM联盟,利用TPM和认证加密技术解决数据在TPM联盟内节点间的可信传输问题,提出了一种基于时间树的TPM联盟管理策略,包括节点配置协议、注册协议、注销协议、实时监控协议、网络管理修复协议和节点更新协议,阐述了时间树的生成算法,分析了建立可信节点管理网络的时间开销和节点状态监控的有效性。最后,通过仿真实验说明了模型具有较好的性能和有效性。 相似文献
15.
对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性. 相似文献
16.
17.
Ching‐Huang Lin Chien‐Tung Lu Ying‐Hsien Chen Jung‐Shian Li 《International Journal of Communication Systems》2014,27(12):4210-4225
One of the key technologies in cloud computing is virtualization. Using virtualization, a system can optimize usage of resources, simplify management of infrastructure and software, and reduce hardware requirements. This research focuses on infrastructure as a service, resource allocation by providers for consumers, and explores the optimization of system utilization based on actual service traces of a real world cloud computing site. Before activating additional virtual machines (VM) for applications, the system examines CPU usage in the resource pools. The behavior of each VM can be estimated by monitoring the CPU usage for different types of services, and consequently, additional resources added or idle resources released. Based on historical observations of the required resources for each kind of service, the system can efficiently dispatch VMs. The proposed scheme can efficiently and effectively distribute resources to VMs for maximizing utilization of the cloud computing center. Copyright © 2013 John Wiley & Sons, Ltd. 相似文献
18.
为了实现红外图像中海面弱小目标的精确检测, 提出了一种基于局部峰值检测和管道滤波 的红外图像处理算法。首先采取局部峰值检测提取疑似目标,然后根据自适应域值处理 去除多数非目 标峰值,最后通过管道滤波法排除残留干扰以准确识别目标。针对算法中包括大量条件判断 和并行计算的 特点,通过比对CPU和GPU的工作特性,最终采用CPU-GPU协作的异构计算模型对算法进 行了加速。 实验结果表明,在大量海面杂波的干扰下,该加速检测算法运行后的目标检测漏警率不高于 3.5%,虚警率 不高于5%,加速比为26,处理分辨率为640 ×512图像的速率不低于32帧/秒,具有很高的 工程应用价值。 相似文献
19.
边缘计算已经成为5G时代重要的创新型业务模式,尤其是其低时延特性,被认为是传统方案所不具备的,因此边缘计算能够提供更多的服务能力且具有更为广泛的应用场景。但边缘计算与处于中心位置的云计算之间的算力协同成为新的技术难题,即需要在边缘计算、云计算以及网络之间实现云网协同、云边协同,甚至边边协同,才能实现资源利用的最优化。在研究边缘计算算力分配和调度需求的基础上,提出了基于云、网、边深度融合的算力网络方案,并针对AI类应用给出了一个典型实施系统,该方案能够有效应对未来业务对计算、存储、网络甚至算法资源的多级部署以及在各级节点之间的灵活调度。 相似文献