共查询到17条相似文献,搜索用时 187 毫秒
1.
针对可重构系统中的数据流驱动应用,提出支持动态可重构的软/硬件统一多线程编程模型SHUMDR及其层次化实现.通过硬件线程接口设计、操作系统内核扩展,便于设计人员以统一的线程视图描述应用的软硬件划分.以数据加密/解密为例进行测试的结果表明,统一线程抽象带来的时间开销和空间资源占用率较小,该模型在探索编程灵活性的同时,能够有效地兼顾硬件的效率. 相似文献
2.
3.
4.
近年来,可重构片上系统已成为科学研究及嵌入式应用领域中应对复杂计算需求的有效技术解决方案.针对目前缺少一个从系统级设计到应用实现,统一、综合规划动态重构问题的系统设计流程,以及动态重构过程对系统设计人员不透明等问题,在系统设计层给出了一种过程级软硬件统一编程模型.在此框架内,设计人员通过调用已根据应用特性进行优化的软硬件协同函数,即可利用高级语言完成系统功能描述;在细节设计层提出了基于单位面积加速比的软硬件任务调度算法,实时管理动态可重构资源;在应用实现层,以可重构专用图形加速卡为原型系统,论述动态可重构系统实现中的关键技术.实验及测试结果验证了通过将动态重构问题置于整个系统设计流程中予以考虑,能够达到提升系统开发效率之目的. 相似文献
5.
可重构片上系统是一种兼具功能灵活性与高运算速度的新型计算平台,是面向未来嵌入式应用市场复杂需求的技术解决方案,但复杂、困难的设计过程必将阻碍它的广泛应用与进一步发展.针对当前可重构片上系统设计过程中编程不透明、可重构资源难以有效利用等问题,结合可编程器件能够根据应用特性动态配置芯片体系结构的特点,提出并实现了一套基于过程级透明编程模型的软硬件协同设计方法.在编程模型框架内,系统设计人员通过调用已根据应用特性进行优化的软硬件协同函数库,即可利用高级语言完成系统功能描述;动态软硬件划分算法在程序运行时对其进行划分,选择、调度需要转换到软件或硬件实现的库函数,并通过动态链接器实时切换函数的运行方式,从而形成一个由功能描述到系统实现的自动化流程.实验及测试结果验证了该方法的可行性和高效性. 相似文献
6.
软硬件划分作为可重构片上系统设计的重要技术手段,其结果直接影响到系统的性能。目前的软硬件划分大多只考虑从算法本身提高划分效果,忽略了划分结果的具体配置实现,导致划分效果很不理想。分析了预配置模型下的任务描述,给出了预配置调度优先级的计算方法,设计了一种预配置调度策略;针对软硬件划分与动态可重构的特点,提出并实现了一种结合预配置的软硬件划分算法,给出了一种评价软硬件划分方案优劣的方法。实验结果表明,该划分方法具有良好的划分效果。 相似文献
7.
CPU/FPGA混合架构是可重构计算的普遍结构,为了简化混合架构上FPGA的使用,提出了一种硬件线程方法,并设计了硬件线程的执行机制,以硬件线程的方式使用可重构资源.同时,软硬件线程可以通过共享数据存储方式进行多线程并行执行,将程序中计算密集部分以FPGA上的硬件线程方式执行,而控制密集部分则以CPU上的软件线程方式执行.在Simics仿真软件模拟的混合架构平台上,对DES,MD5SUM和归并排序算法进行软硬件多线程改造后的实验结果表明,平均执行加速比达到了2.30,有效地发挥了CPU/FPGA混合架构的计算性能. 相似文献
8.
9.
面向微处理器和可编程器件加速器的混合异构多核体系结构的可重构计算环境,采用程序员熟悉的函数描述格式,在运行时根据软硬件划分的结果,动态实现到软件函数实体代码或者硬件函数实现电路的连接。为降低重配置开销,提高系统性能,统计了各个硬件函数的调用次数和次序,并结合其运行时间和硬件面积等信息,设计了一种预配置算法,尽量使配置和计算能够重叠处理,从而缩短系统的整体运行时间,获得更大性能加速。 相似文献
10.
在考虑动态部分重构及重构延时等特征的基础上,采用遗传算法及其与爬山算法的融合实现可重构系统软硬件任务的划分,并采用动态优先级调度算法进行划分结果的评价。实验表明,在可重构系统的资源约束等条件下,算法能够有效地实现应用任务图到可重构系统的时空映射。 相似文献
11.
12.
Michalis D. Galanis Gregory Dimitroulakos Costas E. Goutis 《The Journal of supercomputing》2006,38(1):17-34
A partitioning methodology between the reconfigurable hardware blocks of different granularity, which are embedded in a generic
heterogeneous architecture, is presented. The fine-grain reconfigurable logic is realized by an FPGA unit, while the coarse-grain
reconfigurable hardware by a 2-Dimensional Array of Processing Elements. Critical parts, called kernels, are mapped on the
coarse-grain reconfigurable logic for improving performance. The partitioning method is mainly composed by three steps: the
analysis of the input code, the mapping onto the Coarse-Grain Reconfigurable Array and the mapping onto the FPGA. The partitioning
flow is implemented by a prototype software framework. Analytical partitioning experiments, using five real-world applications,
show that the execution time speedup relative to an all-FPGA solution ranges from 1.4 to 5.0. 相似文献
13.
14.
在很多应用领域已经开展了可重构计算的研究,但是由于缺乏高层设计工具,设计者需要较深的软件和硬件专业知识才能开发GPP/RAU架构的程序,阻碍了其大规模应用。提出了一种面向应用的可重构编译器——ASCRA的初始架构,它可以自动将C语言映射为VHDL语言,从而解决可重构计算中自动编译工具的瓶颈。ASCRA编译器主要研究软硬件划分技术和面向硬件的优化技术,如脉动阵列、循环流水技术。在ML505开发平台上,设计实现了ASCRA编译器的验证平台,并通过实验给出了核心程序段生成VHDL代码的综合信息。 相似文献
15.
Michalis D. Galanis Gregory Dimitroulakos Costas E. Goutis 《The Journal of supercomputing》2006,35(2):185-199
A hardware/software partitioning methodology for improving performance in single-chip systems composed by processor and Field
Programmable Gate Array reconfigurable logic is presented. Speedups are achieved by executing critical software parts on the
reconfigurable logic. A hybrid System-on-Chip platform, which can model the majority of existing processor-FPGA systems, is
considered by the methodology. The partitioning method uses an automated kernel identification process at the basic-block
level for detecting critical kernels in applications. Three different instances of the generic platform and two sets of benchmarks
are used in the experimentation. The analysis on five real-life applications showed that these applications spend an average
of 69% of their instruction count in 11% on average of their code. The extensive experiments illustrate that for the systems
composed by 32-bit processors the improvements of five applications ranges from 1.3 to 3.7 relative to an all software solution.
For a platform composed by an 8-bit processor, the performance gains of eight DSP algorithms are considerably greater, as
the average speedup equals 28. 相似文献
16.
17.
软硬件划分是软硬件协同设计的关键环节,划分的结果直接影响目标系统的设计质量。因此,对于一个给定的应用程序,为了使得目标系统快速执行且成本低廉,合理的划分策略十分重要。由于单个任务具有多种不同的硬件实现方式,与传统的单一硬件实现方式的软硬件划分问题相比,多选择的软硬件划分更能客观地反映现实应用。这导致问题的求解更具挑战性,它们已被证明是NP完全问题。基于多核处理器片上系统并针对任务图为二叉树的应用,建立了多选择软硬件划分问题的计算模型,并提出了解决该问题的动态规划算法。实验结果表明,当问题规模适中时,所提动态规划算法能够有效地获得精确解,并展示了算法的计算能力与硬件面积限制之间的关系。 相似文献