排序方式: 共有158条查询结果,搜索用时 46 毫秒
1.
在设计数字信号处理器时我们经常要设计高性能的乘累加运算器,文章详细分析了乘累加运算器的结构,提出了其高性能设计方案并采用标准单元进行了实现,同时提出了DCT运算单元的高性能解决方案。 相似文献
2.
3.
针对多核多线程处理器中乱序访存影响计算实时性的问题,在对典型访存队列进行研究的基础上提出了一种新的访存队列构建模型及其硬件结构.该模型采用窗口优化算法控制最差情况下的访存延迟,保证访存的实时性,同时又利用优化的乱序调度策略减少访存延迟.实验证明,该访存队列可控制最大访存延迟,与顺序访存相比,存储器具备更高的带宽,与传统的乱序访存相比较,可以充分满足计算的实时性需求,而存储器有效带宽基本不受影响,解决了多核多线程处理器承担实时流计算的基础难题. 相似文献
4.
5.
6.
7.
合理地组织一个多级的高速缓冲存储器(Cache)是一种有效的减少存储器访问延迟的方法。论文提出了一种设计32位超标量微处理器Cache单元的结构,讨论了一级Cache、二级Cache设计中的关键技术,介绍了Cache一致性协议的实现,满足了“龙腾”R2微处理器芯片的设计要求。整个芯片采用0.18umCMOS工艺实现,芯片面积在4.1mm×4.1mm之内,微处理器核心频率超过233MHz,功耗小于1.5W。 相似文献
8.
可将科学计算中大量算法的计算形式视为由流计算和相当比例的通用计算混合而成。针对低并行度计算以及不易流化(Streamlization)的数据结构对流计算整体性能具有较大影响,提出了一种软、硬件可控的适应性片上存储结构DAMS Cache。该结构能够同时适应混杂流计算中流数据以及标量数据的存储需求;采用了适应性动态存储资源分配策略和适应性动态地址映射策略解决地址映射冲突问题;通过全硬件支持非规则流、条件流的存储与访问,混合数据替换策略能够充分挖掘数据的生产者-消费者局部性及时间、空间局部性。验证评估实验表明,相对Cache以及SPM(Scratchpad Memory),DAMS Cache算法的适应性较好,面向混杂流计算的性能较优。 相似文献
9.
高性能微处理器复杂度不断增大,验证也变得更为复杂,已成为设计过程中的瓶颈。文章就兼容微处理器的验证,提出了基于Simics构建系统级验证平台的一种设计方法。通过自行开发的控制模块把Simics提供的ISS(InstructionLevelSimulator)和相关的存储器模型、外围设备与外部仿真器相连构建了一个验证系统平台。在这个平台中Simics支持的处理器作为待验证兼容处理器的参考模型,测试使用的激励来自真实的操作系统和应用程序,自动比较运行结果。借助于Simics的快速仿真速度和现场恢复能力,该平台可大大加快验证速度。 相似文献
10.
优化微程序控制器设计 总被引:3,自引:0,他引:3
大多数CISC处理器和VLIW处理器都采用微程序控制。在这些处理器中,微程序控制器的性能是决定整个处理器性能的关键因素之一。本文探讨微程序控制器的优化设计。分析如何提取公共微操作序列,提出设计寻址入口与功能入口的方法来减少微程序ROM的深度;借鉴页式微程序管理的思想,提出页式微程序ROM设计来减少微程序ROM的位宽。优化设计之后,微程序控制器面积减少28.90%。 相似文献