排序方式: 共有75条查询结果,搜索用时 0 毫秒
61.
62.
基于FPGA的嵌入式多核处理器及SUSAN算法并行化 总被引:1,自引:0,他引:1
给出了四核心嵌入式并行处理器FPEP的结构设计并建立了FPGA验证平台.为了对多核处理器平台性能进行评测,提出了基于OpenMP的3种可行的图像处理领域的经典算法SUSAN算法的并行化方法:直接并行化SUSAN、图像分块处理和多图像并行处理,并对这3种并行算法在Intel四核心平台和FPEP的FPGA验证平台上进行性能测试.实验表明,3种并行算法在两种四核心平台下均可获得接近3.0的加速比,多图像并行处理在FPEP的FPGA验证平台可以获得接近4.0的加速比. 相似文献
63.
共享内存多线程编程是挖掘多核处理器并行性的重要方法,然而,共享内存的多线程程序在运行时存在不确定性,线程间的内存竞争是导致不确定性的主要来源。内存竞争信息量大,记录时带来的开销大,实现内存竞争记录是确定性重演共享内存多线程程序的关键。分别概括了现有软件实现的内存竞争记录机制和硬件实现的内存竞争记录机制,并对内存竞争记录的研究现状进行了总结,指出了当前内存竞争记录技术面临的挑战。 相似文献
64.
通过引入二级trace cache做为一级trace cache补充,捕获那些由于一级trace cache容量冲突而被换出的trace,能够部分缓解trace cache容量失效问题.在进一步提高处理器的性能的同时,也大大降低了为构造trace而对指令cache带宽的要求,空闲的指令cache带宽可以进一步被trace的预构及其他一些技术所利用.实验表明,在64KB一级Trace Cache的基础上,引入一个容量为1MB的二级Trace Cache后,对于go和gcc这类工作集较大的程序,处理器的性能提高了13%,指令cache带宽要求下降27%. 相似文献
65.
一种阵列计算机输入/输出系统的设计 总被引:1,自引:0,他引:1
ABC95阵列是采用FPGA设计的多功能互连结构的计算机,多功能互连网络是指支持处理器到存储器的矩阵无冲突访问模式和增强型的处理机到处理机通讯的MESH网络。ABC95阵列机是一种协处理机方式的SIMD计算机,I/O系统的设计非常重要,必须保证通用性好,易于扩展,有足够的数据传送带宽。 相似文献
66.
67.
68.
FPGA是目前在数字系统设计中普遍使用的技术。由于FPGA芯片的容量和管脚数的比例往往与具体的设计实体之间存在较大差异。设计的实现效率因此而受到较大影响。为了解这一问题,提出了一种汇集的方法,并在ABC95阵列机的向量处理部件PE的实现中得到了应用和验证,获得了较好的性能价格比。 相似文献
69.
70.
为了满足半空间拷贝垃圾回收的实时性需求,克服在半空间拷贝回收过程中因大量的内存拷贝操作带来的时间开销方面的不足,提出了一种将对象分类并进行不完全拷贝的回收机制.针对大对象的生命周期较长及空间分布的连续性特点,在半空间拷贝回收的遍历阶段,对活动的大对象采取只标记不拷贝的策略,被标记的对象仍留在起始空间,通过增加一个整理阶... 相似文献