期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

佟凤辉樊晓桠王党辉辛明瑞《微电子学与计算机》2003,20(3):13-16,20

SIMD处理机特别适合于要求大量高速向量或矩阵计算的场合,数据缓存系统和对准网络是它的关键部件。而图像卷积是图像处理技术中最基本也是最重要的一项技术,文章根据数字图像的卷积定理对数字图像的卷积运算进行了分析,在此基础上提出了一种基于SIMD处理机的可变卷积模板的图像卷积处理器的体系结构。该处理器内部包含有接口部件、控制部件、数据缓存系统、对准电路和执行部件等。它的极高效率的数据缓存系统和对准电路成为该处理器最有特色的部分,它从根本上解决了图像卷积中的数据复用带来的CPU重复访问主存储器的问题。实现了3×3、5×5、7×7、9×9、11×11、13×13和15×15卷积模板的图像卷积运算的变换而无需另行更改硬件电路的特点。最后,对这个图像卷积处理器体系结构的性能进行了缜密的分析。相似文献

2.

基于龙芯2号处理器的SPEC 2000测试程序的分析与应用

王全胜《现代电子技术》2010,33(17):202-204

为了对我国自主研发的龙芯2号处理器的性能进行评价,获取龙芯2号处理器性能的客观数据。提出一种针对龙芯2号处理器的采用由国际标准性能评测组织开发的、专门用于评价CPU性能的SPEC CPU2000测试程序的测试和分析的方法。该方法包括在Linux操作系统下安装和配置SPEC 2000程序的要点和使用SPEC 2000程序对龙芯2E处理器进行性能测试的具体流程,还包括对SPEC 2000程序运行结果的分析。目前该方法已经应用,效果良好。相似文献

3.

龙芯处理器商用密码指令集运算性能分析

徐海波《数字通信世界》2023,(9):86-88

文章介绍了龙芯处理器3A5000内置硬件加密模块,支持商用密码SM2/3/4,通过搭建测试环境,对龙芯3A5000处理器运算SM2/3/4算法的速度和吞吐量进行了测试,并与其他8款市面上主流的处理器进行了比较;对测试结果进行了分析,根据英特尔CPU的指令集机制进行了估算,与上一代处理器进行了对比,并对下一代处理器进行了展望。相似文献

4.

多核CPU系统结构分析与建模

张志峰林正浩《集成电路应用》2006,(1):51-53

多核已经成为通用处理器设计技术的最重要发展方向。由于多核芯片内具有多个处理蠡核，芯片的缓存结构、线程调度等与传统CPU有很大的区别，本文探讨了多核芯片的基本结构特征，并基于指令集级系统仿真工具Simics建立了多核CPU模拟环境用于进行分析。相似文献

5.

龙芯处理器性能测试方法研究

李士刚黄威张鹏《现代电子技术》2013,(23):88-90

通过分析龙芯处理器的体系架构、指令集的特点,基于龙芯的硬件平台和Linux操作系统的兼容性,提出一套全面测试龙芯处理器性能的方法,以实际测试龙芯2F处理器为例,获得测试结果,客观评价龙芯处理器的性能,对于军用计算机国产化具有重要意义。相似文献

6.

多核处理器核间的通信研究与实现

《现代电子技术》2016,(16):83-87

针对多核处理器的特点提出一种新型的异构多核DSP处理器结构。主处理器为通用处理器,作为控制密集型处理器核用于系统管理和控制;8个DSP作为计算密集型处理器核,用于大信息量融合计算。详细设计8个DSP之间的No C互连结构。首先采用2×4 2D Turos结构进行单个路由节点结构的设计,包括数据包格式、路由和仲裁设计;其次对路由节点进行编码、路由算法设计和确定节点路由方向。该结构具有总线局部通信带宽高的优点,采用No C的易扩展性和No C在各DSP之间通信的并行性使系统规模易于扩展并满足大批量数据传输要求。最后通过仿真实验,验证了该设计的有效性,为后续多核处理器的设计与实现打下坚实的技术基础。相似文献

7.

基于多核处理器的面向时延敏感服务的云基础架构

万志涛《电信科学》2011,(Z1)

给出了一种采用MIPS指令集的64核处理器Tilepro64作为硬件平台,实现了可以达到亚毫秒级处理时延的云计算基础架构作为基带信号处理和关键应用的支撑平台,实现了在多核处理器上的运算并行优化、动态平衡负载、时延保证、服务注册机制的设计和实现。相对于x86通用处理器,该云计算平台功耗低、密度高、能效比高;相对于专用硬件,开发成本低、周期短。相似文献

8.

三家国产高端CPU厂商的探索实践

迎九《电子产品世界》2017,24(9)

在今年上半年深圳举办的"第一届中国高端芯片高峰论坛"的"高端处理器发展战略研讨"上,龙芯、飞腾和兆芯介绍了其CPU发展思路、战略及产品. 相似文献

9.

龙芯的持久战

胡伟武《半导体行业》2009,(3)

自从我们在2001年初正式开始龙芯处理器的设计以来,龙芯已经走过了八年的历史。在这八年中,我们从无到有地掌握了高性能处理器的核相似文献

10.

国产龙芯三代四核处理器明年年初正式推出

《中国集成电路》2009,18(1):92-92

中科院计算所所长李国杰院士近日表示，国产龙芯三代芯片预计将在明年年初正式推出，龙芯三将是我国自主产权的首款多核处理器，它的面世将打破国外多核处理器的垄断局面，提升我国国产CPU的整体水平。相似文献

11.

Distributed method for cracking WPA/WPA2‐PSK on multi‐core CPU and GPU architecture

下载免费PDF全文

Liu Yong‐lei Jin Zhi‐gang 《International Journal of Communication Systems》2015,28(4):723-742

To overcome the limitations of the existing brute force cracking method of Wi‐Fi Protected Access/Wi‐Fi Protected Access II (WPA/WPA2)‐pre‐shared key (PSK) based on single core CPU or one core of a multi‐core CPU, a new distributed multi‐core CPU and GPU parallel cracking method (DMCG) was first proposed. Colored Petri nets was used to validate the four‐way handshake protocol and proved that DMCG could successfully crack WPA/WPA2‐PSK. In DMCG, the PSK list was distributed to each PC reasonably using distributed technology. Multiple computing cores were made up of multi‐core CPU and GPU on single PC to crack in parallel. GPU contributed to the cracking speed improvement due to the strong computing power for intensive parallel tasks. Experimental results showed that DMCG improved the cracking speed by two orders of magnitude and would exhibit more notable advantages with high‐performance distributed system as the cracking speed improved by three or four orders of magnitude, compared with the computing power of one CPU core. An improved Amdahl's law was first proposed, by which the upper bound of the cracking speedup was analyzed. Aiming to the DMCG expansion of cloud computing based on GPU, a lightweight framework called Dandelion computing model was first proposed. Moreover, the analysis of the influences of the graphics card parameters on the cracking speed was processed, and accordingly, the decision support for choosing graphics card in DMCG based on analytic hierarchy process was provided. Finally, the performance optimization of DMCG was processed. Copyright © 2013 John Wiley & Sons, Ltd. 相似文献

12.

云计算热点问题分析 总被引：6，自引：0，他引：6

李德毅陈桂生张海粟《中兴通讯技术》2010,16(4):1-4

在云计算的研究和应用中一些热点问题比较突出,如：如何理解计算资源及其虚拟化、云计算与网格计算的差异、云计算中心与高性能计算机的关系、云安全和云标准等。文章对此给出了一些见解：计算资源的虚拟化促使信息服务走向规模化、集约化和专业化;网格计算是＂多为一＂,而云计算是＂一为多＂;部署于高性能计算中心的高性能计算机未必适合云计算;云安全已经将传统安全问题发展为服务方和被服务方之间的信任和信任管理问题;在现有标准的基础上,云计算标准将需更加关注服务的互操作等。相似文献

13.

基于多核并行计算的舰艇通用视频录取系统

王黎明郑健吕琳杨飞海《电子设计工程》2011,19(13):52-54

针对目前舰艇标准显控台视频录取的弊端,设计开发了一种基于多核并行计算的视频录取系统,并利用微软.NET4.0规范中的并行任务库进行软件实现。与现有基于多线程并发计算的数据录取系统对比,基于新算法的系统录取的视频数据帧率均衡稳定,系统响应快,CPU使用率低,系统可扩展性强。系统可通过扩展,实现更高的系统集成度和使用效率。相似文献

14.

基于TPM联盟的可信云平台管理模型

田俊峰常方舒《通信学报》2016,37(2):1-10

以可信计算技术为基础,针对可信云平台构建过程中可信节点动态管理存在的性能瓶颈问题,提出了基于TPM联盟的可信云平台体系结构及管理模型。针对TPM自身能力的局限性,提出了宏TPM和根TPM的概念。针对可信云中节点管理时间开销大的问题,引入时间树的概念组织TPM联盟,利用TPM和认证加密技术解决数据在TPM联盟内节点间的可信传输问题,提出了一种基于时间树的TPM联盟管理策略,包括节点配置协议、注册协议、注销协议、实时监控协议、网络管理修复协议和节点更新协议,阐述了时间树的生成算法,分析了建立可信节点管理网络的时间开销和节点状态监控的有效性。最后,通过仿真实验说明了模型具有较好的性能和有效性。相似文献

15.

结构网格CFD应用程序在天河超级计算机上的高效并行与优化

下载免费PDF全文

王勇献张理论车永刚徐传福刘巍程兴华《电子学报》2015,43(1):36-44

对多区结构网格大规模CFD流场模拟的高效并行方法进行了研究,以天河超级计算机平台的CPU同构计算环境和CPU+MIC异构计算环境为例,重点讨论了CFD应用特点与超级计算机运行环境相适应的性能优化与改进策略,发展了一系列多层次并行与性能优化方法.通过在天河2高性能计算平台上进行了多个算例的数值模拟,验证了这些优化方法的并行效果;在CPU+MIC异构平台上模拟的最大CFD问题规模达到6800亿个网格单元,共使用137.6万CPU+MIC处理器核,测试结果表明在CPU+MIC异构平台上移植优化后的程序性能提高2.6倍左右,且具有良好的可扩展性. 相似文献

16.

面向云的分布式集群四叉树任务分配策略

曾志刘仁义张丰刘南《电信科学》2010,26(10)

分布式集群系统是云计算环境的基础,针对当前云计算环境高性能计算的需求,更好地发挥系统的运行效率,本文在分析了已有网格计算环境下分布式任务分配方法的基础上,从软件角度采用动态负载均衡思想,依据网络节点计算力模型,提出了海量数据集群环境计算的四叉树任务分配策略。验证表明,本任务分配策略能有效地提高整体计算速度。相似文献

17.

Resource allocation in cloud virtual machines based on empirical service traces

下载免费PDF全文

Ching‐Huang Lin Chien‐Tung Lu Ying‐Hsien Chen Jung‐Shian Li 《International Journal of Communication Systems》2014,27(12):4210-4225

One of the key technologies in cloud computing is virtualization. Using virtualization, a system can optimize usage of resources, simplify management of infrastructure and software, and reduce hardware requirements. This research focuses on infrastructure as a service, resource allocation by providers for consumers, and explores the optimization of system utilization based on actual service traces of a real world cloud computing site. Before activating additional virtual machines (VM) for applications, the system examines CPU usage in the resource pools. The behavior of each VM can be estimated by monitoring the CPU usage for different types of services, and consequently, additional resources added or idle resources released. Based on historical observations of the required resources for each kind of service, the system can efficiently dispatch VMs. The proposed scheme can efficiently and effectively distribute resources to VMs for maximizing utilization of the cloud computing center. Copyright © 2013 John Wiley & Sons, Ltd. 相似文献

18.

海面弱小目标红外检测算法的高速实现

张雅楠陈绪光许文海《光电子．激光》2019,30(5):516-521

为了实现红外图像中海面弱小目标的精确检测, 提出了一种基于局部峰值检测和管道滤波的红外图像处理算法。首先采取局部峰值检测提取疑似目标,然后根据自适应域值处理去除多数非目标峰值,最后通过管道滤波法排除残留干扰以准确识别目标。针对算法中包括大量条件判断和并行计算的特点,通过比对CPU和GPU的工作特性,最终采用CPU-GPU协作的异构计算模型对算法进行了加速。实验结果表明,在大量海面杂波的干扰下,该加速检测算法运行后的目标检测漏警率不高于 3.5%,虚警率不高于5%,加速比为26,处理分辨率为640 ×512图像的速率不低于32帧/秒,具有很高的工程应用价值。相似文献

19.

基于云、网、边融合的边缘计算新方案:算力网络

下载免费PDF全文

雷波刘增义王旭亮杨明川陈运清《电信科学》2019,35(9):44-51

边缘计算已经成为5G时代重要的创新型业务模式,尤其是其低时延特性,被认为是传统方案所不具备的,因此边缘计算能够提供更多的服务能力且具有更为广泛的应用场景。但边缘计算与处于中心位置的云计算之间的算力协同成为新的技术难题,即需要在边缘计算、云计算以及网络之间实现云网协同、云边协同,甚至边边协同,才能实现资源利用的最优化。在研究边缘计算算力分配和调度需求的基础上,提出了基于云、网、边深度融合的算力网络方案,并针对AI类应用给出了一个典型实施系统,该方案能够有效应对未来业务对计算、存储、网络甚至算法资源的多级部署以及在各级节点之间的灵活调度。相似文献

20.

奇异值分解算法优化 总被引：4，自引：1，他引：3

下载免费PDF全文

王佰玲田志宏张永铮《电子学报》2010,38(10):2234-2239

奇异值分解算法在信号处理、图像处理、信息安全等领域均有重要应用.针对该算法存在的性能问题,提出了基于gamma:1驱动的数据重用模型,提高计算负载平衡性,降低数据通信量;给出基于多处理器的并行分解模型,数值试验均表明算法具有较高的并行加速比和效率. 相似文献