首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
针对多核共享Cache动态划分技术存在硬件存储开销较大、划分颠簸等问题,提出了一种渐变的多核共享Cache动态划分算法。渐变算法旨在追求最优划分性能的同时,减小划分机制实现的硬件开销。渐变算法采用基于组相联Cache路的划分机制,每次划分时最多只允许1路的Cache转移。具有硬件存储开销小、划分稳定、易于实现等特点。例如,对于1MB的16路组相联L2Cache,渐变的Cache动态划分机制仅增加0.01%的硬件存储开销,与UCP方法比较,增加的硬件存储开销可减小至6.25%。  相似文献   

2.
为了有效使用异构多核架构强大的并行计算能力,根据硬件架构的特点重新组织数据并合理调度任务的执行是非常有必要的.提出一个基于不规则性的并行计算方法,是一个融合数据并行、任务并行、管道并行的多重并行计算方法,特别适合具有动态特征执行行为和不规则数据结构的复杂算法,能够在程序运行时根据存储局部性原则和单指令多数据流(SIMD)操作机制对任务执行进行基于优先级的动态调度和数据管理,能够最大限度地有效使用CPU和GPU的硬件计算资源和存储资源.实验结果表明,该方法能够提高图形并行绘制算法关于动态执行过程和不规则数据结构构造和维护的性能.  相似文献   

3.
该文针对IPv6网络应用日趋频繁带来的NAT-PT中地址映射表规模变大、地址转换速度下降的问题,提出了一种高速网络环境下地址映射查找算法。该算法将转化条目组织成哈希表和多位树,并引入Cache机制。给出了重要数据结构的定义,算法设计思想和算法性能分析,该算法能有效地加快转换条目的搜索过程,提高了NAT-PT的性能。  相似文献   

4.
为了解决云存储系统中存储I/O性能优化的问题,从数据分布的角度进行研究,建立了存储分片性能模型,并以此为基础给出了以I/O性能最优为目标的分片决策算法以及最优分片数的计算方法,提出了基于动态混合分片机制的数据分布算法(DADH).DHAH能充分考虑各存储节点和客户机的实际性能,动态地进行文件分片决策和最优分片数的计算,并且能根据存储节点的实际性能优化数据分布.实验结果表明:DADH较传统数据分布算法具有最优的I/O性能,并且算法性能提升效果在各种带宽下平均达到18%~44%.  相似文献   

5.
针对实时环境下交通信息实时、动态的特性,提出了实时环境下基于混合的动态路径优化算法。该算法在广义自适应A~*算法的基础上,结合剪枝算法,同时引入了粒子群算法局部最优及全局最优智能存储、模糊时间窗等优化策略。剪枝算法以当前局部最优为阈值,从而能够有效控制阈值的大小;模糊时间窗约束算法优化时间以及控制仿真时间,从而使算法更好地适应实时环境。实验数据采用纽约地图数据,并在仿真实验环境下,分别验证了优化策略的有效性,同时,将优化算法与A~*算法进行了对比实验。实验证明:优化策略在动态路径优化算法中是有效且合理的,可适应于动态路径诱导系统。  相似文献   

6.
提出了基于深度混合动力电动汽车的牵引力分层控制方法。上层控制中提出了基于动态滑模的驱动轮目标驱动力矩制定策略;下层控制中提出了电机转矩单独控制策略、基于转矩动态协调的发动机电机协调控制策略以及工况识别逻辑。最后开发了仿真和硬件在环试验平台,结果表明,本文方法能够快速、准确、平稳地实现对打滑车轮的控制,改善了深度混合动力汽车的起步性能、加速性能以及稳定性能。  相似文献   

7.
磁盘阵列Cache算法的优劣是决定磁盘阵列性能的关键因素之一,精确的测试和评估方法对设计高效率的Cache算法至关重要.为了精确评估磁盘阵列中Cache算法的性能及其对系统I/O性能的影响,设计了一个Cache算法测评系统.依据磁盘阵列的系统构成和运行模式,建立了评估Cache算法的运行环境模型,包括I/O操作的产生和排队模块、Cache算法插槽模块、预取算法模块和磁盘模拟器4个部分.其中I/O操作的产生和排队模块能够产生多种形式的I/O操作负载及重放实际系统的I/O操作负载;Cache算法插槽模块用来挂载待评估的Cache算法;磁盘模拟器采用DiskSim,保证了测量磁盘I/O操作响应时间的精确性.系统能够精确测量Cache算法的命中率,以及对存储系统I/O操作平均响应时间的影响.实际测量了LRU算法的命中率和I/O操作平均响应时间,测量结果与既有的研究成果相吻合,从而验证了系统的性能.因此,系统具有良好的可靠性、可用性和可扩展性.  相似文献   

8.
针对闪存硬盘的快速发展趋势以及存取特性,提出一种数据库复合存储模型.在该模型中,数据库同时包括闪存硬盘和磁性硬盘2种设备,数据根据访问特征被存储到不同的设备中.模型使用地址映射表来转换对闪存访问,并使用滑动窗口技术,通过最近一段时间内访问的统计信息和设备本身的物理特性,自适应地动态调整页面的分布,使数据库获得更高的性能.通过基于在线事务处理应用的性能仿真测试,结果表明,该复合模型可以显著提高I/O性能,并对工作集的变化有良好的适应性.  相似文献   

9.
为了解决已有卷积神经网络(convolution neural networks, CNNs)加速器,因无法适应混合量化CNN模型的计算模式和访存特性而引起加速器效率低的问题,设计了可适应混合量化模型的可重构计算单元、弹性片上缓存单元和宏数据流指令集。其中,采用了可根据CNN模型结构的重构多核结构以提高计算资源利用率,采用弹性存储结构以及基于Tile的动态缓存划分策略以提高片上数据复用率,采用可有效表达混合精度CNN模型计算和可重构处理器特性的宏数据流指令集以降低映射策略的复杂度。在Ultra96-V2平台上实现VGG-16和ResNet-50的计算性能达到216.6和214 GOPS,计算效率达到0.63和0.64 GOPS/DSP。同时,在ZCU102平台上实现ResNet-50的计算性能可达931.8 GOPS,计算效率可达0.40 GOPS/DSP,相较于其他类似CNN加速器,计算性能和计算效率分别提高了55.4%和100%。  相似文献   

10.
面向图形和图像处理的轻核阵列机结构   总被引:1,自引:1,他引:0  
提出一种适用于图形和图像处理的高效并行阵列机结构。该结构的处理单元有单指令多数据(SIMD)和多指令多数据(MIMD)两种运行模式,兼有异步执行机制、硬件的多线程管理器和高效通信机制。这些机制使得此种阵列机能够实现效率很高的线程级并行运算、数据级并行运算和操作级并行运算。尤其值得指出的是,此种阵列机的流处理性能可以达到或接近专用集成电路的性能。该结构还能有效实现静态与动态数据流计算。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号