排序方式: 共有23条查询结果,搜索用时 15 毫秒
1.
用一种遗传算法的调度策略,以大维度矩阵求逆为实验对象,探索在多核中如何完成任务的均衡分配问题,以达到加速效果.算法利用系统资源的弹性,自动搜寻可以并行的子任务并将其合理地分配到相应计算节点中,提高了多核系统资源调度性能,实现了对用户提交的任务的优化调度,达到了均衡系统各处理器计算负载和提高多核系统的总体性能的目标. 相似文献
2.
《电子技术应用》2017,(3):16-20
如今FFT卷积广泛应用于数字信号处理,并且过去几年证实了异构多核可编程系统(HMPS)的发展。另外,HMPS已经成为DSP领域的主流趋势。因此,研究基于HMPS大点FFT卷积的高效地实现显得非常重要。基于重叠相加FFT卷积方法,设计一款针对输入数据流的高效流水重叠相加滤波器。介绍了基于HMPS的大点FFT卷积实现,获得了高精度的滤波效果。此外,采用流水技术的滤波器设计,提高系统处理速度、数据吞吐率和任务并行度。基于Xilinx XC7V2000T FPGA开发板上的实验表明,参与运算的采样点越大,系统的任务并行度、处理速度和数据吞吐率就会越高。当采样点达到1M时,系统的平均任务平行度达到了5.33,消耗了2.745×10~6个系统时钟周期数,并且绝对误差精度达到10~(-4)。 相似文献
3.
用户可重构系统芯片-U-SoC 总被引:2,自引:0,他引:2
随着深亚微米技术(DSM)的不断发展,完全专用的系统芯片(SoC)已经面临新的问题和挑战.本文在研究硅技术发展趋势、硅产品特征循环规律以及硅产业结构演变规律的基础上,提出了一种具有一定"通用"性的用户可重构系统芯片(UserreconfigurableSoC,简称U-SoC),它通过用户重构功能降低新产品的开发成本,缩短上市周期,提高设计效率,从而增强了SoC的适应性和灵活性.研究U-SoC设计方法,对于加速我国微电子产业的发展进程,实现跨越式发展有重要作用. 相似文献
4.
Mesh结构是目前最普遍的多核系统架构,得到了广泛的应用,但受结构制约,Mesh网络并不适用于某些嵌入式应用工作。基于上述考虑,本文提出了一种簇结构的多核系统架构设计与实现过程,详细介绍了簇的结构组成,簇内外通讯机制,并使用矩阵连乘验证了设计结果的正确性,簇型多核系统的性能可以达到单核处理器的2.31倍。 相似文献
5.
32×32高速乘法器的设计与实现 总被引:3,自引:2,他引:1
设计并实现了一种32×32高速乘法器.本设计通过改进的基4 Booth编码产生部分积,用一种改进的Wallace树结构压缩部分积,同时采用一种防止符号扩展的技术有效地减小了压缩结构的面积.整个设计采用Vetilog HDL进行了结构级描述,用SIMC 0.18μm标准单元库进行逻辑综合.时间延迟为4.34 ns,系统时钟频率可达230 MHz. 相似文献
6.
任务调度问题是多核处理器相关技术的一个重要组成部分。 基于列表的调度算法因其低复杂度和高效率得到广泛关
注,但确定任务优先级列表方法的单一性使得算法对解空间搜索不够,易陷入局部最优。 为此,提出一种基于任务扰动的迭代
型列表调度算法(task perturbation iteration algorithm, TPIA)。 该算法通过选取任务扰动因子按照一定扰动策略进行调度列表迭
代,对迭代后的列表进行贪心选择,生成更优的调度列表序列以得到更好的调度结果。 通过实例和随机有向无环图(DAG)有
限集对算法进行验证,结果表明算法能有效改善调度解,调度性能提升平均可达 16. 51%,适宜处理大规模、高出入度的复杂
DAG 图;针对 TPIA 算法在低任务总数高通讯开销情况下性能有所下降的问题,对平均任务节点数 130 以下的任务图进行分组
测试,获得了对应的 CCR 上界值及其变化趋势。 相似文献
7.
8.
9.
3D NoC映射通常涉及大量IP核及节点,使传统映射算法效率较低.为减少映射算法的执行时间,提高其优化能力,在传统蚁群算法(ACA)的基础上,提出一种动态蚁群算法(DACA).该算法采用逻辑斯蒂S形函数的变化形式,在每轮迭代开始前,依据当前迭代次数动态调整参数α,β及蚂蚁总数M.实验结果表明,与ACA相比,DACA可以缩短执行时间,提高算法性能;在面向随机任务时,其单位时间优化能力可以提升38.2%~65.9%;而当面向多媒体系统的真实应用时,其单位时间优化能力可以提升25.3%~32.7%. 相似文献
10.
设计了一种面向计算密集型应用的多核混合架构可重构计算系统MRCS。其可重构处理器中的可重构阵列计算单元负责密集规则的运算,浮点处理器负责离散运算,配合灵活的本地缓冲,有效地提高了多核可重构计算系统对算法的适应性。实现了一个能够稳定地运行在100 MHz的基于FPGA的MRCS原型,并通过分别映射大维度浮点矩阵乘法、IDCT算法和运动估计算法进行性能验证。实验结果表明MRCS具有更高的计算效率和灵活性。 相似文献