共查询到7条相似文献,搜索用时 0 毫秒
1.
研究了众核处理器的访存公平性问题。针对众核处理器距离访存资源较近的处理单元拥有较大的访存带宽而造成的访存公平性问题,提出了一种面向大数据应用的众核处理器访存公平性调度机制:最少最远(LFF)优先访存。这种机制的原理如下:依据处理单元距离访存资源的距离以及处理单元访存的次数来调度访存顺序,以保证各个处理单元的公平性。首先,访问次数较少的节点被赋予更高的访存优先权。其次,在具有相同访问次数的节点中,距离更远的节点优先访存。再次,在相同距离的节点中,已被选中优先次数少的有优先级。实验评估表明,该调度机制能够有效解决众核处理器的访存公平性问题,其公平性调度效果优于FR-FCFS,PAR-BS、ATLAS。在1024核情况下,系统异步率由FR-FCFS的15.5%降低到1.89%。 相似文献
3.
嵌入式图形处理器(GPU)随着访存数据量越来越大,访存子系统在性能、面积及功耗等方面的瓶颈已经日益凸显。针对图形处理器的数据特点及访存需求,考虑到嵌入式图形处理器面积及功耗的约束,结合Godson GPU架构平台,提出了一种面向嵌入式图形处理器的访存子系统结构设计。该设计主要针对图形处理流水线的访存特点,对cache的结构进行了优化,并提出了一种基于链表方式的结构,提高了访存的效率,减少了面积且降低了功耗。为了使访存子系统适配并行图形流水线,提出了一种屏幕分区方法,可以在消除cache的一致性问题的同时,使访存子系统的负载更加均衡。该设计为嵌入式图形处理器的访存子系统设计提供了借鉴。 相似文献
4.
现有的搜索引擎无法搜索出Deep Web信息,针对这样的情况本文提出了基于Deep Web数据集成系统的预取系统,建立了基于多项式回归的预取模型,描述了预取队列的生成过程,并且给出了缓存替换策略及缓存一致性策略。 相似文献
5.
针对并行矢量空间叠加分析中存在的I/O性能差及并行算法调度效率低的缺陷,提出了"去"归并通用并行计算架构(NJ-GPCA)。该架构首先基于内存数据库Redis设计内存矢量空间数据模型;其次通过数据预处理以及任务分发技术,减少进程等待,提高I/O性能;最后重新进行任务分配以及规划进程调度,避免结果数据归并收集,使得并行叠加分析算法归并收集阶段的时间复杂度由O(nlogn)降低到O(n)。实验结果表明,该方法对真实地理数据下的并行叠加分析操作,I/O时间至少减少75%,对于提高算法整体性能有明显效果。 相似文献
6.
7.
电热驱动的鞘状人工肌肉已经展示出广阔的应用前景.当受到高电流产生的焦耳热影响时,它们的鞘层会膨胀和软化,有效地释放芯部纤维内储存的扭转能量,这种现象显著地提高了驱动性能.本工作制备了一种包裹在聚二甲基硅氧烷(PDMS)鞘层中的预捻碳纳米管(CNT)人工肌肉纤维.施加频率为0.25 Hz的50 mA电流,其可以产生13.28%的收缩变形和9.82 MPa的收缩应力,功率密度为3.8 Wg-1.得益于非螺旋结构,CNT纤维@PDMS的运行速率可达42%s-1,我们据此开发了快速运行的开关和仿生臂.有趣的是,我们观察到即使在较弱的电流不足以诱导驱动所需的PDMS鞘层膨胀和软化的情况下,CNT纤维@PDMS的驱动性能也有所改善.为了解释这一现象,我们提出了一种鞘层致密化机制.当电流通入CNT纤维时,其内部CNTs间产生的安培吸引力也会引发驱动,PDMS鞘层在固化过程中产生沿CNT纤维径向分布的收缩应力,会使CNTs间距减小,从而提升安培吸引力.我们通过检测CNT纤维@PDMS在不同温度下的驱动行为、内部微观结构、力学和电学性能的变化证实了这种致密化机... 相似文献