首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 380 毫秒
1.
功能部件是处理器中进行指令运算的核心单元,它的算法及其实现直接影响到处理器的总体性能.介绍了龙芯2号处理器的功能部件,探讨了从算法到物理设计等不同层次的功能部件设计方法.龙芯2号功能部件分为两个定点ALU和两个浮点ALU实现,除实现完整的MIPS定、浮点指令集外,还实现了龙芯2号类MMX自定义多媒体指令集以及定点操作在浮点部件(FPU)中的数据通路复用.龙芯2号浮点部件遵照IEEE754和MIPS相关标准,浮点加法4拍完成,浮点乘法5拍完成,浮点除法4~17拍完成.物理设计支持0.18μm工艺下主频500MHz的标准单元实现,浮点单精度峰值性能达到2GFLOPS.双精度峰值性能达到1GFLOPS.  相似文献   

2.
《电脑爱好者》2005,(8):11-11
3月29日,中科院计算所宣布正式发布龙芯2号CPU,据中科院透露,龙芯2号采用0.18微米的工艺,实现主频500MHz、SPEC CPU 2000测试分值超过300的64位通用CPU芯片。SPEC分值的指标意味着这款芯片的实际性能与1GHz的奔腾4差不多,是龙芯1号实测性能的10到15倍。  相似文献   

3.
Dr.B T 《电脑自做》2006,(11):125-130
2006年9月13日是我国龙芯计划一个重要的里程碑。“64位龙芯2号增强型处理器(简称龙芯2E.英文名为Godson-2)”通过科技部验收.该处理器最高主频达到1GHz.实测性能超过1.5GHz奔腾4处理器水平。同日.“龙芯2号增强型处理器”通过了科技成果鉴定。值得注意的是,龙芯2家族中.2E是第一款量产的处理器.同时.装备龙芯2E的龙梦电脑即将投入市场.这标志着龙芯2代处理器进入产业化进程。 龙芯2从最初型号发展到现在的2E.经历了怎样的变化?龙芯2采用MIPS架构.比起目前的主流CPU性能究竟如何?龙梦电脑能和大家熟悉的主流PC竞争吗?Windows操作系统能否支持龙芯处理器?应用程序软件能否满足大众的需求?这些都是大家关心的问题。[编者按]  相似文献   

4.
事件     
《互联网周刊》2005,(12):6-6
国产64位CPU"龙芯2号"诞生4月18日,由中国科学院计算技术研究所自主研发,被国人寄予厚望的国产首款64位高性能通用CPU--"龙芯2号"问世。采用0.18微米制程工艺制造的"龙芯2号",最高时钟频率为500MHz,实测性能是1.3GHz的威盛处理器的2-3倍,这已经基本和英特尔奔腾3处理器处于同一水平。和22个月前发布的"龙芯1号"相比,定位在Linux桌面网络终端、低端服务器、网络防火墙、路由器交换机、多媒体网络终端、无盘工作站等应用的"龙芯2号",性能提高幅度也达到了10倍。科技部、信产部和中科院计算所还将与早先成立的龙芯产业联盟、龙芯开放实验室一起,逐步围绕"龙芯2号"大力打造更为成熟和更具操作性的产业链:中科院计算所和江苏梦兰集团合作建立的"中科梦兰"龙芯产业化基地正式揭牌;海尔与江苏梦兰将联手生产、研发、销售基于"龙芯2号"的系列税控收款机、POS机以及电脑;信产部还将针对微软的WinCE嵌入式操作系统开展向"龙芯2号"平台的移植工作。(陈琼)  相似文献   

5.
HPNetServerE200处理器IntelePentiumIII600MHz处理器,133MHz前端系统总线高速缓存:芯片集成256kBL2高速缓存ECC内存标准配置64MBECCSDRAM;最大内有容量达768MBI/O扩展槽:4个PCI插槽(SCSI型为2个,IDE型为3个),1个ISA插槽控制器:嵌入式双通道U/66IDE控制器可选附加SCSI控制器卡支持操作系统W.ndowsNI-40ServerWindowsNT40SmallBus]nessServerW]ndows2000AdvancedServerNovellNe叭Nare51以及RedHatLllUX61(产品查询号000715001)HPN幻serVerLT6000了处理器最多可支持6个IntelPentiumillXeo…  相似文献   

6.
英特尔公司近日宣布,它于今年早些时候发布的英特尔至强5600系列处理器,正在为目前全球最强的高性能计算机“天河一号A”提供性能动力。“天河一号A”部署于中国天津的“国家超级计算中心”内,它配备了总计14,396颗英特尔处理器及多块加速卡,性能可达空前的2.57petaflops(千万亿次浮点计算/秒)。  相似文献   

7.
业界资讯     
《微型计算机》2010,(34):100-100
英特尔为“天河一号A”超级计算机提供核心芯片 英特尔公司近日宣布,目前全球最强的高性能计算机“天河一号A”配备了总计14396颗英特尔至强5600系列处理器及多块加速卡,性能可达空前的2.57petaflops(千万亿次浮点计算/秒)。“天河一号A”部署在中国天津的。  相似文献   

8.
CC-NUMA(高速缓存非均匀访存)系统应用在龙芯3A的处理器上,已得到了良好的性能体现,程序开发也有明显的简化。在维护片内和片间数据传输的稳定性和正确性的工作中,对基于一致性协议的片间互连结构进行分析和研究。为了构建更大规模的CC-NUMA系统而维护多处理器间的一致性。在片间利用互连桥片进行统一调度,从而保证跨系统访问和全局数据一致,并且实现了多核处理器在访存性能上的提升。所设计的桥片在部分结构上与龙芯3A二级缓存相似。通过定向和随机环境测试,验证了桥片在功能方面的正确性。  相似文献   

9.
《现代计算机》2006,(12):42-45
10月10日,四川国芯科技有限责任公司向媒体透露,专门为中小学生学习研发的龙芯笔记本电脑已经完成设计,即将投入小规模样品生产。Sinomanic学生笔记本电脑采用400MHz龙芯1号处理器(GS52i)、128MB内存、10.2寸彩色宽屏液晶显示器、40GB硬盘,配备大量学习课件与名校辅导材料、英汉字典、数学公式、学习软件等。Sinomanic取“中国人的芯片”之意。  相似文献   

10.
IBM公司1998年10月中旬推出用于RS/600043PUnix工作站的Power3超标量处理器。Power3处理器适用于图形处理和数据挖掘等高档应用。Power3处理器内置8个指令器,比帮助IBM”深蓝”巨型机去年击败国际象棋大帅卡斯波夫的Zo,ver2处理器多2个。Power3N“以执行PowerPC指令系统,具有跟P0werPC兼容的16字节系统总线。Power3处理器具有每秒6.4GB的超高带宽,存储器子系统适合支持高度超标量的核心。Power3开始采用较为保守的0.25pmCN10S6SZ工艺、时钟频率为200MHz,但浮点操作和整数性能仍分别达到了30多SPecmarks和13.ZSPec9…  相似文献   

11.
Microarchitecture of the Godson-2 Processor   总被引:26,自引:3,他引:23       下载免费PDF全文
The Godson project is the first attempt to design high performance general-purpose microprocessors in China. This paper introduces the microarchitecture of the Godson-2 processor which is a 64-bit, 4-issue, out-of-order execution RISC processor that implements the 64-bit MlPS-like instruction set. The adoption of the aggressive out-of-order execution techniques (such as register mapping, branch prediction, and dynamic scheduling) and cache techniques (such as non-blocking cache, load speculation, dynamic memory disambiguation) helps the Godson-2 processor to achieve high performance even at not so high frequency. The Godson-2 processor has been physically implemented on a 6-metal 0.18μm CMOS technology based on the automatic placing and routing flow with the help of some crafted library cells and macros. The area of the chip is 6,700 micrometers by 6,200 micrometers and the clock cycle at typical corner is 2.3ns.  相似文献   

12.
多核处理器的性能与系统软件有着密切的联系:操作系统是处理器与应用程序之间的接口,对于充分利用处理器特性和提高应用程序的性能起着极其重要的作用;编译器与处理器体系结构密切相关,一方面要产生处理器支持的二进制代码,另一方面还要结合处理器特性产生高效运行的代码,其性能好坏直接影响着系统的整体性能.为了提高龙芯3A系统的实际性能,从操作系统和编译器着手,结合龙芯3A微结构特征,进行了一系列有效的优化.这些措施包括CC-NUMA多核操作系统的实现、操作系统二级Cache锁机制、操作系统调度共享二级Cache分配、自动向量化编译和支持预取机制的编译等.实验结果表明,在系统软件中增加对处理器特性的支持,能够充分挖掘体系结构的优势,对系统性能有较大的好处.其性能优化技术对于其他处理器的优化也有一定的借鉴价值.  相似文献   

13.
龙芯2号同时多线程处理器的软硬件接口设计   总被引:1,自引:0,他引:1  
随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术,而多线程处理器的软硬件接口也就成为急需解决的问题.在分析同时多线程的软件需求的基础上,提出龙芯2号同时多线程处理器的软硬件接口协同设计解决方案,给出相应的操作系统实现方案.同时,在Linux 2.4.20的基础上实现了龙芯2号同时多线程处理器相应的操作系统.通过运行SPEC CPU2000等测试程序进行性能评测,充分说明实现软硬件接口的龙芯2号同时多线程处理器极大地提高了多进程负载的性能.分析和设计方案不仅适用于同时多线程处理器,而且对于片内多核处理器的设计也有借鉴作用.  相似文献   

14.
龙芯2号处理器的同时多线程设计   总被引:1,自引:0,他引:1  
提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明,龙芯2号同时多线程处理器通过挖掘线程级并行性,将龙芯2号处理器的性能提高了31.1%.  相似文献   

15.
系统软件作为处理器和应用程序之间的接口,对于充分利用处理器的特性来维护处理器与应用程序的稳定性和提高应用程序的性能起着极其重要的作用.描述了在Linux内核中解决龙芯2号处理器的Cache别名问题的方法以及通过增加页的大小、软TLB和FAST_TLB_REFILL的方法减小TLB失效的性能损失,还有Uncache Accelerate对媒体播放软件的加速.实验结果表明,在系统软件中增加这些方法的支持,对系统的稳定性和性能都有较大的好处.  相似文献   

16.
The Godson-3B processor is a powerful processor designed for high performance servers including Dawning Servers.It offers significantly improved performance over previous Godson-3 series CPUs by incorporating eight CPU cores and vector computing units.It contains 582.6 M transistors within 300 mm2 area in 65 nm technology and is implemented in parallel with full hierarchical design flows.In Godson-3B,advanced clock distribution mechanisms including GALS (Globally Asynchronous Locally Synchronous) and clock mesh are adopted to obtain an OCV tolerable clock network.Custom-designed de-skew modules are also implemented to afford further latency balance after fabrication.The power reduction of Godson-3B is maintained by MLMM (Multi Level Multi Mode) clock gating and multi-threshold-voltage cells substitution schemes.The highest frequency of Godson-3B is 1.05 GHz and the peak performance is 128 GFlops (double-precision) or 256 GFlops (single-precision) with 40 W power consumption.  相似文献   

17.
Montecito: a dual-core, dual-thread Itanium processor   总被引:2,自引:0,他引:2  
McNairy  C. Bhatia  R. 《Micro, IEEE》2005,25(2):10-20
Intel's Montecito is the first Itanium processor to feature duplicate, dual-thread cores and cache hierarchies on a single die. It features a landmark 1.72 billion transistors and server-focused technologies, and it requires only 100 watts of power. Intel's Itanium 2 processor series has regularly delivered additional performance through the increased frequency and cache as evidenced by the 6-Mbyte and 9-Mbyte versions.  相似文献   

18.
The Godson-2G microprocessor is a high performance SOC which integrates a four-issue 64-bit high performance CPU core(called GS464),a DDR2/3 controller,a HyperTransport controller,a PCI/PCI-X controller,etc.It is physically implemented in 65 nm CMOS process and reaches the frequency of 1GHz with power consumption less than 4 W.The main challenges of Godson-2G physical implementation include nanometer process technology effects,high performance design targets,and tight schedule.This paper describes the ke...  相似文献   

19.
矩阵乘法作为高性能计算中的关键组成部分,是一种具有计算和访存密集特点的典型应用,因此优化矩阵乘法的性能对通用处理器是非常重要的.为了提高矩阵乘法的性能,本文提出了一种性能模型,用于预测通用处理器上矩阵乘法的执行时间.该模型反映了矩阵乘法执行时间与通用处理器的运算部件、访存带宽、寄存器个数等结构参数之间的关系,可以指导处理器结构的优化来平衡计算和访存能力、提高执行速度.基于该模型本文给出了在一个优化的通用处理器结构中,寄存器个数和访存带宽应满足的理论下界.本文在Godson-3B处理器平台上对该性能模型进行了验证,实验结果表明矩阵乘法执行时间的预测精确度达到95%以上.基于该模型,本文还提出了一种对Godson-3B结构进行优化的方法,使矩阵乘法的执行时间减少了50%左右.  相似文献   

20.
Although the design of many kinds of microprocessors has been under developing for several decades,the computer architecture R&D community lacks well documented lessons and experiences about design decisions in the research literature.In this paper,we systematically present the design decisions we made during the designing and prototyping of Godson-2 series processors.The 250MHz Godson-2B,450MHz Godson-2C,and 1GHz Godson-2E processors that implement 64-bit,four-issue,out-of-order architecture were taped out in 2003,2004,and 2005,respectively.Each processor triples its predecessor in the SPEC CPU2000 rates.Our first-hand experiences and lessons gained from these designs would provide unique perspectives and insights that are not available in any existing text books and/or published papers.We summarize 10 critical lessons and experiences based on hundreds of our attempts at architectural and design optimizations for performance improvement of Godson-2 series processors.The issues include silicon-simulation correlation,design balancing,performance optimizing,and pico-architecture tuning.We conclude that persistent improvement,attitude towards work-on-silicon design, and insightful understanding of software and fabrication process are the three most important factors for designing a high performance processor with low energy consumption.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号