首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
介绍了龙芯2号增强型处理器(以下简称龙芯2E)配套北桥的总体架构、模块互连以及各个模块的设计和优化工作。测试结果表明,优化使龙芯2E系统的FTP上传带宽提升了36.6%,系统的整体性能达到了In-tel Pentium4 1.4 GHz的水平并足以胜任各种格式流媒体的解码和播放。  相似文献   

2.
基于PMON的龙芯BIOS初始化及VGABIOS模拟器   总被引:2,自引:1,他引:1       下载免费PDF全文
阐述基于PMON扩展后的龙芯基本输入输出系统(BIOS)的初始化流程以及ATI显卡BIOS的模拟器原理,针对自检过程中PC!设备的初始化、视频图形阵列(VGA)BIOS模拟器以及北桥的地址空间分配等关键性问题,给出相应的解决办法。经过调试和测试,扩展后的龙芯BIOS已在基于龙芯2E处理器的主板上可靠运行,能稳定加载为龙芯2E移植的LinuxDebian操作系统内核。  相似文献   

3.
针对卫星数字电视接收的低成本应用,提出一种基于龙芯的DVB-S卫星数字电视接收系统方案。采用龙芯2E平台的PCI总线,充分应用龙芯处理器对MPEG-2的高效解码特性,结合特定前端调谐器和后端TS流捕获芯片设计整个系统。结果表明,该系统符合DVB- S/MPEG-2标准,且结构简单、便于实现、成本低廉,对拓展龙芯处理器产业化应用有重要工程应用价值。  相似文献   

4.
为了在龙芯2E处理器上建立稳定的Java运行环境,丰富龙芯平台的上层软件库,以Kaffe这款开源Java虚拟机为移植对象,分析了其运行机制,确定了其代码结构中平台相关的3个主要模块:SysCallMethod、Trampoline和JTT,并结合龙芯2E处理器的特点,给出了相关模块的修改方案.最后用第三方的测试标准对移植后的虚拟机进行了测试,表明了移植的有效性.  相似文献   

5.
王明  彭成磊  都思丹 《计算机工程》2009,35(17):223-225
针对龙芯2E平台不能流畅播放视频文件的问题,对视频变换过程进行优化,采用一种新的离散余弦变换(DCT)算法,基于龙芯2E多媒体指令集对其进行实现,用该算法替代FFmpeg软件中的DCT算法。测试结果表明,新的DCT算法性能比传统DCT算法提高近11倍,优化后的FFmpeg软件编码速度提高10%左右。  相似文献   

6.
交叉开关是交换芯片和芯片组的核心逻辑。该文设计并实现了多处理器芯片组中的交叉开关,其工作频率在FPGA布局布线后可以达到100 MHz。通过实践采样,对延迟和带宽进行测试,提出性能优化的策略,目前该交叉开关已稳定运行于龙芯2E多处理器系统中。  相似文献   

7.
基于龙芯2F处理器设计紧凑型便携机主板,基于处理器内部集成的PCI总线接口扩展显示、USB2.0、IDE、千兆网络等多种外围接口,突破系统电源设计、中断路由实现等关键技术,运行VxWorks操作系统,已经应用于项目,运行稳定可靠。  相似文献   

8.
设计并实现了一个网络计算机系统方案.该方案采用国产高性能龙芯2E处理器和自主设计的北桥,对于主板上的电源设计、北桥设计、信号完整性等关键问题给出了相应的解决方法.针对信号完整性问题提出了先期约束后期仿真的布线机制,提高了高速信号系统板级设计的可靠性.理论分析和实验结果表明,该方案是一个通用可靠的龙芯2E板级系统方案.  相似文献   

9.
对轻量级技术的Docker技术进行了概述,针对Docker1.13+版本基于龙芯平台进行了移植并集成到Fedora28系统中,制作测试镜像对新版本Docker方案进行了性能测试分析,剖析了不同容器数量下的性能变化趋势和容器的性能瓶颈.通过龙芯单路、双路、四路服务器和AMD Ryzen5(2400 GB)主机进行了容器内的性能对比测试实验,肯定了龙芯平台上的新版Docker方案的稳定性,并分析了龙芯3A3000芯片与Ryzen5(2400 GB)芯片相近主频下的性能差异,展望了国产CPU芯片事业的发展前景.  相似文献   

10.
基于龙芯2号处理器(Godson 2)研制了一符合PC104 Plus总线标准的处理器模块,介绍了模块结构和系统核心北桥的实现.并结合实际应用的需求,设计了一功能扩展模块,该模块集成了AD、DA通道,IO通道,信号频率测试功能,具有较高的集成度.通过两者构建了一具有标准前向通道、后向通道、存储模块的综合参数测试系统,实际验证表明该系统可满足大多数测试测量场合的需求,并可根据需要采用其它标准PC104模块进行功能扩展.  相似文献   

11.
The Godson-2G microprocessor is a high performance SOC which integrates a four-issue 64-bit high performance CPU core(called GS464),a DDR2/3 controller,a HyperTransport controller,a PCI/PCI-X controller,etc.It is physically implemented in 65 nm CMOS process and reaches the frequency of 1GHz with power consumption less than 4 W.The main challenges of Godson-2G physical implementation include nanometer process technology effects,high performance design targets,and tight schedule.This paper describes the ke...  相似文献   

12.
龙芯2号处理器的同时多线程设计   总被引:1,自引:0,他引:1  
提出了适合龙芯2号处理器的同时多线程处理器模型,并介绍了具体的微体系结构设计以及相应的Linux操作系统的实现方案.通过在设计的龙芯2号同时多线程处理器上启动Linux操作系统,并运行应用程序,例如SPEC CPU2000,进行性能评测.结果表明,龙芯2号同时多线程处理器通过挖掘线程级并行性,将龙芯2号处理器的性能提高了31.1%.  相似文献   

13.
This paper introduces the microarchitecture and physical implementation of the Godson-2E processor, which is a four-issue superscalar RISC processor that supports the 64-bit MIPS instruction set. The adoption of the aggressive out-of-order execution and memory hierarchy techniques help Godson-2E to achieve high performance. The Godson-2E processor has been physically designed in a 7-metal 90nm CMOS process using the cell-based methodology with some bitsliced manual placement and a number of crafted cells and macros. The processor can be run at 1GHz and achieves a SPEC CPU2000 rate higher than 500.  相似文献   

14.
计算机系统整体性能的提高不仅仅依赖于处理器计算能力的提升也需要高性能芯片组的有力支持.芯片组承担着CPU和外围设备通信的重任,而且目前大多数系统中采用把内存控制器集成在北桥中的方法,这更加突出了北桥在访存性能以至于在整个系统中的关键作用.以高性能为目标,龙芯2C处理器配套北桥芯片NB2005的设计和优化采用了很多新的方法和技术,其中包括根据程序行为进行动态Page管理的内存控制电路,一种与内存控制电路状态相结合的预取策略和具备高吞吐量低延迟的PCI通道设计等.性能测试和分析表明,搭配NB2005的龙芯2C系统访存带宽要比搭配Marvell GT64240北桥的系统提高40%以上,运行SPEC CPU2000浮点和定点程序的性能分别提高了12.2%和2.5%,磁盘I/O的性能也提高了30%.  相似文献   

15.
Although the design of many kinds of microprocessors has been under developing for several decades,the computer architecture R&D community lacks well documented lessons and experiences about design decisions in the research literature.In this paper,we systematically present the design decisions we made during the designing and prototyping of Godson-2 series processors.The 250MHz Godson-2B,450MHz Godson-2C,and 1GHz Godson-2E processors that implement 64-bit,four-issue,out-of-order architecture were taped out in 2003,2004,and 2005,respectively.Each processor triples its predecessor in the SPEC CPU2000 rates.Our first-hand experiences and lessons gained from these designs would provide unique perspectives and insights that are not available in any existing text books and/or published papers.We summarize 10 critical lessons and experiences based on hundreds of our attempts at architectural and design optimizations for performance improvement of Godson-2 series processors.The issues include silicon-simulation correlation,design balancing,performance optimizing,and pico-architecture tuning.We conclude that persistent improvement,attitude towards work-on-silicon design, and insightful understanding of software and fabrication process are the three most important factors for designing a high performance processor with low energy consumption.  相似文献   

16.
龙芯2号同时多线程处理器的软硬件接口设计   总被引:1,自引:0,他引:1  
随着生产工艺的提高,芯片上能集成越来越多的晶体管,多线程技术也逐步成为一种主流的处理器体系结构技术,而多线程处理器的软硬件接口也就成为急需解决的问题.在分析同时多线程的软件需求的基础上,提出龙芯2号同时多线程处理器的软硬件接口协同设计解决方案,给出相应的操作系统实现方案.同时,在Linux 2.4.20的基础上实现了龙芯2号同时多线程处理器相应的操作系统.通过运行SPEC CPU2000等测试程序进行性能评测,充分说明实现软硬件接口的龙芯2号同时多线程处理器极大地提高了多进程负载的性能.分析和设计方案不仅适用于同时多线程处理器,而且对于片内多核处理器的设计也有借鉴作用.  相似文献   

17.
多核处理器的性能与系统软件有着密切的联系:操作系统是处理器与应用程序之间的接口,对于充分利用处理器特性和提高应用程序的性能起着极其重要的作用;编译器与处理器体系结构密切相关,一方面要产生处理器支持的二进制代码,另一方面还要结合处理器特性产生高效运行的代码,其性能好坏直接影响着系统的整体性能.为了提高龙芯3A系统的实际性能,从操作系统和编译器着手,结合龙芯3A微结构特征,进行了一系列有效的优化.这些措施包括CC-NUMA多核操作系统的实现、操作系统二级Cache锁机制、操作系统调度共享二级Cache分配、自动向量化编译和支持预取机制的编译等.实验结果表明,在系统软件中增加对处理器特性的支持,能够充分挖掘体系结构的优势,对系统性能有较大的好处.其性能优化技术对于其他处理器的优化也有一定的借鉴价值.  相似文献   

18.
龙芯3号互联系统的设计与实现   总被引:5,自引:1,他引:4  
龙芯3号的互联结构设计采用了一种基于二维Mesh的可伸缩分布式多核结构,可为芯片级、主板级和系统级的互联提供统一的拓扑结构和逻辑设计.龙芯3号的对外接口采用扩展的HyperTransport协议,既可以用于连接IO,又可以实现多芯片的互联.在龙芯3号的互联结构中还设置了软件路由配置机制,可以在板级直接构筑中等规模的CC-NUMA系统和更大规模的NCC-NUMA系统,提供高效的通信机制.介绍了基于龙芯3号的多处理器系统互联架构.采用了双层可伸缩互联结构:片内由二维Mesh连接多个结点.结点内由交叉开关连接多个处理器核和二级缓存模块.片间无需额外硬件支持即可通过支持缓存一致性的HyperTransport接口实现16核的多处理器系统.利用层次化目录技术,龙芯3号还可以支持更大规模的多处理器系统.龙芯3号的互联架构为搭建简洁、高效、灵活、高度可扩展的共享存储多处理器系统提供了有力支持.  相似文献   

19.
龙芯2号处理器设计和性能分析   总被引:16,自引:4,他引:16  
介绍龙芯2号处理器设计及其性能测试结果.龙芯2号采用四发射超标量超流水结构。片内一级指令和数据高速缓存各64KB,片外二级高速缓存最多可达8MB.为了充分发挥流水线的效率,龙芯2号实现了先进的转移猜测、寄存器重命名、动态调度等乱序执行技术以及非阻塞的Cache访问和load Speculation等动态存储访问机制.龙芯2号处理器采用0.18gm的CMOS工艺实现,在正常电压下的最高工作频率为500MHz,500MHz时的实测功耗为3~5W.龙芯2号单精度峰值浮点运算速度为20亿a/秒,双精度浮点运算速度为10亿a/秒,SPECCPU2000的实测性能是龙芯1号的8~10倍,综合性能已经达到PentiumⅢ的水平.目前芯片样机能流畅运行完整的64位中文Linux操作系统,全功能的Mozilla浏览器、多媒体播放器和OpenOffice办公套件,可以满足绝大多数桌面应用的要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号