首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
为降低多核系统中任务迁移的开销,在片上网络分布式多核系统的基础上实现一种低开销的任务迁移方案。借助于多核消息传递接口模型中并行程序与任务映射无关的特点,采用更新任务映射表的方式完成任务的重新映射,通过在μC/OS-II操作系统中传递任务的堆栈以及任务控制块实现任务状态在多核节点间的传递,任务迁移到另一节点后能够恢复原来的状态继续执行,不需要传递任务代码,并且任务状态的保存不需要迁移点。实验结果证明,该任务迁移方案能够及时响应任务迁移请求,具有低开销的特点,可较好地满足系统中任务的实时性要求。  相似文献   

2.
多核处理器的软件和硬件设计从传统的任务串行到任务并行处理,与单核处理器软硬件设计区别较大。本文以8核DSP芯片TMS320C6678为例,介绍了多核DSP的系统结构、多核处理器的任务分割和任务分配到各个核的方法、多个核之间的任务管理和核间通信,以及基于多核导航器的硬件设计方法。  相似文献   

3.
在XML查询处理中,目前普遍的算法仍然使用传统的串行处理模式,无法充分利用多核资源的优势.针对此问题,设计了一种基于任务抢占与数据分区的XML多核优化策略(Imp-NBPP),它对XML文档进行数据分区,以达到负载平衡,让各个线程独立处理分区内的数据,减少了线程之间同步与通信带来的开销.同时还探讨了任务抢占在多核查询中的应用.实验表明,对于不同大小的XML文档,基于节点数(NBP),基于文档大小(SBP)与本文所提策略,这三种策略与单核查询相比均能有效的节约查询时间;使用Imp-NBPP策略时,在节约查询时间和负载平衡方面均优于NBP、SBP策略.  相似文献   

4.
任务粒度是决定任务并行程序性能的关键因素,鉴于不同应用其最优的任务粒度可能不同,提出一种异构多核Cell处理器上支持OpenMP3.0的自适应任务粒度策略.该策略首先广度生成任务,直到所有的线程达到饱和,之后若某个线程执行完自身任务而处于空闲状态时,通过回溯到忙碌线程的任务树中最早可以派生任务的结点处生成新任务,以供空闲线程窃取执行.该策略不仅保证生成的任务粒度最大化,并且有效地解决了负载不均衡问题.实验在一个Cell处理器上进行,结果表明与顺序执行速度相比,自适应任务粒度策略达到了4.1到7.2的加速比,并且该策略优于现有的Tascell和AdaptiveTC方案,同时对于绝大部分应用表现出了良好的可扩展行.  相似文献   

5.
关联任务在多核处理器上并行调度所产生的通信时延,会对任务调度长度和处理器利用率造成负面影响,为了改善多核系统对关联任务的处理性能,针对关联任务在多核处理器上的调度特点,提出一种并行感知调度算法.计算各任务与终点间的最长路径值,按照该值的降序来分配任务调度次序,在分配处理器内核时兼顾关联度和任务最早可执行时间,设置最佳匹...  相似文献   

6.
由于嵌入式系统的规模和功能越来越庞大,传统的设计方法的局限性愈加明显,为此提出一种基于通用互联网络的多核嵌入式系统设计方法,通用互联网络由单元库、探测点、优化收敛算法和内核单元4部分组成.其中,单元库用于帮助设计者便捷地搭建各种拓扑结构的嵌入式系统,并将复杂的算法映射在系统上;探测点嵌入在搭建的系统内,能在系统执行算法时对延时、功耗、吞吐率等系统性能进行评估;优化收敛算法依靠探测点获得的信息找到使系统性能最佳的拓扑结构和算法映射;内核单元的任务是对配置好的系统进行仿真,并得到相应的数据和优化结果.文中方法可以在设计早期对复杂嵌入式系统进行分析和寻优,缩短了开发周期、提高了设计性能.最后以环形总线和粒子滤波算法为实验系统,说明了该方法的有效性.  相似文献   

7.
对多核片上系统(MPSoC)而言,随着集成度和性能的提升,时钟网络的结构愈发重要.研究了基于结构建模的多路全局/局域时钟网络的结构建模与分析.通过建立多级级联,分别从主干、支干和接入三层对时钟网络的结构进行建模.针对运算单元接入数、单行中肋排数目、运算单元中输入时钟数目以及时钟区域数等几方面,评估了时钟网络性能.以Stratix V E FPGA为例对时钟网络综合分析,分析结果表明,四象限的对称结构权衡了多项性能指标,是最优的时钟网络结构,可以作为一种通用结构应用在目前主流MPSoC上.  相似文献   

8.
在多核系统中,任务调度是决定系统性能的关键因素之一。为优化任务调度,基于一些典型的任务调度算法(如PPA,徐成提出的算法等),提出了一种新的任务调度算法。该算法一方面合理确定前驱任务复制的先后顺序,而且进行两个阶段的复制,从而可以复制更多的前驱任务以减少调度长度和处理器上空余时间;另一方面,通过去除不影响任务系统调度长度的冗余簇,然后进行簇之间的合并,以减少处理机的数目和调度长度。实验表明,改进后的算法在任务调度的性能上优于典型算法。  相似文献   

9.
借助混沌免疫遗传优化算法对于BP神经网络进行训练,建立基于混沌免疫遗传算法的混合神经网络模型.针对混沌免疫遗传神经网络计算工作量大,训练速度慢的缺点,利用Matlab的Parallel Computing Toolbox对于所建立的混沌免疫遗传神经网络模型进行并行化算法设计实现,并对渤海海区年极值冰厚数据进行预测,对比分析了串行和并行算法的计算效率和加速比,表明基于多核系统的并行化设计算法可以提高加速比和计算效率.  相似文献   

10.
11.
对多核操作系统的发展状况进行了综述,指出了多核操作系统的发展滞后于多核技术发展的现状,介绍了多核操作系统的起源和国内外研究状况,分析了多核操作系统研究中面临的一些主要问题及已有的研究成果。最后,对多核操作系统的一些研究方法进行了总结。  相似文献   

12.
面向多核处理器的共享cache优化研究进展   总被引:1,自引:0,他引:1  
由于技术的发展,片上多核处理器上的核数量和片上缓存的大小一直在增长,且缓存占据了芯片的大部分面积,使得片上缓存所消耗的能量成为存储器子系统中功率损耗的主要贡献者,因此对片上缓存进行优化是提高存储器系统效率的主要途径,增强了片上多核处理器的运算性能.针对共享缓存的管理、一致性等方面介绍了共享缓存的主流优化技术,并探讨了未来的研究方向.  相似文献   

13.
提出了异构多核图形处理器(HMGPU)存储管理系统的硬件实现方法,采用固定分区与分页式分区两种方式分别对大片连续数据与小片非连续数据进行管理,使用Verilog语言进行硬件设计和仿真,并在FPGA开发板上进行了验证。实验结果表明,该系统为HMGPU提供了2 021.2 MB/s的有效存储带宽。  相似文献   

14.
采集77头纯种大白母猪的469个仔猪胎盘性状和生长性状资料.应用个体动物模型和MTDFREML,软件进行了遗传统计分析,估计了胎盘效率(初生重与胎盘重的比率)和遗传力及其与生长性状的遗传相关。结果表明,胎盘效率有较高遗传力0.46;胎盘效率与断奶重、达100kg日龄、日增重和背膘厚的遗传相关分别为0.03、-0.45、0.37和0.12,选择胎盘效率对生长性状的影响较小。  相似文献   

15.
赵纯  龙翔  王雷 《微型机与应用》2012,31(2):53-55,59
分区操作系统是综合化航空电子领域中的核心技术。随着单核性能极限的到来,处理器结构向着多核发展。将两者结合起来,在多核分区操作系统的基础上研究分析多核处理器结构为分区操作系统带来的影响。经分析实验数据得出多核处理器结构在多核处理器中共享Cache结构和内核中临界资源并发访问两方面对分区操作系统产生影响。  相似文献   

16.
首先介绍了目前星载SAR(合成孔径雷达)系统构成,从中分析出开展高性能多核处理器的必要性和紧迫性。接下来介绍了正在研发的面向SAR雷达信号处理的异构多核SoC,详细介绍了芯片的系统结构和片上网络总线。芯片内总线采用多层二维网格总线,每层总线内部存在两种传递模式:动态传递和静态传递。动态面向数据包的灵活传递,静态面向高速数据流传递。最后,在性能和功耗等方面与目前常用的数字信号处理器进行了对比,并说明此异构多核SoC对SAR雷达信号处理结果。  相似文献   

17.
采用开源LEON3(basic version)处理器,运行Linux操作系统,并驱动西安邮电大学自主设计研发的基于传统GPU架构的可编程图形处理器,实现了包含可编程图形系统的SoC平台。将系统集成到Dini Group最新的DNV6_F2PCIE开发板上,采取OpenGL编程,通过鼠标、键盘、显示器运行2D、3D程序,进行图形的绘制,从而比较充分地验证了图形系统硬件设计。  相似文献   

18.
为还原多维不确定投入产出关系在效率评价理念、理论与评价方法方面存在的创新需求,从评价目标导向、评价要素构成和要素关联不确定三个维度,刻画一般效率评价情景中的要素间不确定关联呈现特征。在此基础上,针对现有方法在提取投入产出指标多维关联、刻画多类型效率涌现路径、促成多元效率内涵横向比较等方面存在的不足,创新性融合ANP方法与DEA方法构建了能够应对复杂情景下多维效率内涵提取、转换与融合需求的新方法。案例应用结果表明,以上所提出的理论及方法有效、可行,对延伸及拓展DEA方法的相对权比较理念实现复杂投入产出关联的跨层次比较,具有一定借鉴价值。  相似文献   

19.
为满足大规模虚拟现实应用在渲染速度和显示分辨率等方面的要求,采用基于多核平台的PC集群系统,构建了高性价比的分布式图形渲染系统。系统充分结合多核PC集群中节点内部的并行和节点间的并行,通过对视景体的缩放和投影中心的移动实现了灵活的分屏,集群节点内部从渲染流水线、循环迭代、函数级三个层次进行了多核并行优化,有效地提高了并行绘制系统的效率。实验结果表明:多核平台与并行绘制系统结合,以多线程的方式有效地提高了应用程序性能。  相似文献   

20.
传统数码印花机采用PC完成图像数据处理和传输,数据带宽低,喷印速度慢。为此,设计以Tilera嵌入式多核处理器为核心的高速数码印花系统。系统通过两路千兆光纤以太网接收图像数据,采用多核处理器实时完成数据解压缩和图像转置。提出移位转置的算法来代替遍历转置算法,使转置效率得到明显提升。处理器以共享内存与mailbox技术方式实现不同核之间的数据共享与同步,大大提高了系统的工作效率。另外利用现场可编程门阵列(FPGA)完成数据格式转换和喷印输出。测试结果表明,系统连接8个喷头的总输出带宽可达1.9 Gb/s,支持分辨率600 dot/inch下高达720 m2/h的喷印速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号