期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

郭海林陈香兰《计算机系统应用》2015,24(12):110-117

多核处理器已经成为主流,并且被广泛应用于嵌入式设备中.在操作系统如何有效支持多核处理器方面的研究中,目前国内外大多基于常见的紧耦合共享存储架构的多核处理器,而对一些特殊存储架构的多核处理器研究并不多.本文针对内存受限的多级存储架构的多核处理器,提出一种单代码多数据的嵌入式多核操作系统模型.实验表明,该模型应用在具有多级存储架构的八核DSP上,比AMP模型减少约80%的代码空间开销;与SMP模型相比,与实时性紧密相关的时间开销减少约10倍. 相似文献

2.

用线程级推测技术在多核体系结构上并行化科学计算应用

王耀彬安虹郭锐闫洁路璐《小型微型计算机系统》2010,31(2)

线程级推测技术使在多核上加速传统上难以手工或自动并行化的串行程序成为可能,它不仅需要合理地选择线程的划分策略,而且需要合理地选择适合推测执行的应用.已有的大量研究主要集中在如SPEC CPU这样的桌面应用领域,为了全面地认识TLS技术的应用适用性,本文探讨TLS技术对科学计算应用的性能提升潜力,提出一套TLS适用性的基本判定准则,实验结果表明采用该技术加速SPLASH2中的多数应用可以有效利用16核及以上的计算资源. 相似文献

3.

A Scalable Distributed Shared Memory Architecture

Krishnamoorthy S. Choudhary A. 《Journal of Parallel and Distributed Computing》1994,22(3)

Scalability of a multiprocessor architecture depends on its ability to manage interconnection network latency with increasing number of processors. Interconnection network latency can be minimized by reducing the distance traversed by a message in terms of number of nodes and wire lengths. Scalability of a DSM architecture also depends on the scalability of the coherency protocol and the associated directory storage requirements. In this paper we describe a DSM architecture based on a fat tree interconnection network with augmented switching nodes. The proposed architecture is CC-NUMA, but supports several important features of COMA architectures. The scalability of this architecture is enhanced by integrating routing and cache coherency operations, which helps in improving locality by trapping requests locally. Scalability of a DSM architecture is defined and evaluated in terms of the asymptotic speedup of an algorithm with increasing number of processors. 相似文献

4.

基于分布/共享内存层次结构的并行程序设计 总被引：1，自引：0，他引：1

李清宝张平《计算机应用》2004,24(6):148-150,158

分布内存结构和共享内存结构各具特点,又有很强的互补性,分布／共享内存层次结构将两种结构相结合,以充分发挥其优势。文中主要讨论基于分布／共享内存层次结构的并行程序设计问题,介绍了MPI和OpenMP混合并行程序设计模式。相似文献

5.

面向多层次分布式商业应用的管理平台架构

下载免费PDF全文

刘丹军詹剑锋马捷江滢《计算机工程》2007,33(9):263-265

对于被集中部署到机群环境中的应用服务来说，为了保障服务的负载均衡和高可用特性，通常会配备冗余的软硬件资源，并采用相应的管理系统[1]，帮助调配这些资源、维持稳定的服务质量。然而，商业分布式应用的规模日益庞大，如何让管理系统适应其复杂结构，该文提出了一种解决方案。该方案通过定义形式化模型，建立了一套描述复杂多层次应用结构、判定应用运行状况的方法，并在此基础上构建了具有广泛适应性的平台环境，使得部署于机群之上的复杂商业应用在此架构下得到统一的管理。相似文献

6.

Memory and Network Architecture Interaction in an Optically Interconnected Distributed Shared Memory System

《Journal of Parallel and Distributed Computing》1995,25(2):144-161

This paper develops a performance model of an optically interconnected parallel computer system operating in a distributed shared memory environment. The performance model is developed to reflect the impact of low level optical media access protocol and optical device switching latency on high level system performance. This enables the model to predict the performance impact of supporting distributed shared memory with different address allocation schemes and media access protocols. The passive star-coupled photonic network operates through wavelength division multiple access. Two media access protocols are examined for this WDM network, both are designed to operate in a multiple-channel multiple-access environment and require each node to possess a wavelength tunable transmitter and a fixed (or slow tunable) receiver. A semi-Markov model has been developed to study the interaction of the distributed shared memory architecture and the two access protocols of the photonic network. This analytical model has been validated by extensive simulation. The model is then used to examine the system performance with varying numbers of nodes and wavelength channels and varying, memory and channel access times. 相似文献

7.

Scaling out NUMA-Aware Applications with RDMA-Based Distributed Shared Memory

下载免费PDF全文

Hong Yang Zheng Yang Yang Fan Zang Bin-Yu Guan Hai-Bing Chen Hai-Bo 《计算机科学技术学报》2019,34(1):94-112

Journal of Computer Science and Technology - The multicore evolution has stimulated renewed interests in scaling up applications on shared-memory multiprocessors, significantly improving the... 相似文献

8.

两级分布式共享存储器结构及算法 总被引：1，自引：0，他引：1

伊鹏罗敏轩靳毓国郭云飞《计算机科学》2004,31(4):61-63

商用存储器的随机访问速率和交换结构的交换速率一直是限制高速路由器性能提高的主要因素,改善交换结构使其降低对存储器存取速率的要求是解决问题的关键。本文提出了两级分布式共享存储器(TSDSM)结构,给出了该结构模拟输出排队调度算法所需存储器个数的下界及相应的模拟FCFS与PIFO输出排队算法,并对算法模拟输出排队算法的可行性给出了证明。TSDSM结构及相应的算法控制机制不仅使目前商用存储器的存取速率能满足交换速率的要求,而且交换结构可以工作于非加速状态。相似文献

9.

多核系统共享内存资源分配和管理研究

高珂陈荔城范东睿刘志勇《计算机学报》2015,38(5)

对于共享内存资源的多核系统来说,分配和管理有限的内存资源是一个非常重要且具有挑战性的问题.随着处理器核数的快速增长,不同线程间的访存请求对系统中共享内存的竞争也愈发激烈,由此导致的对系统性能和系统公平性的影响也更加显著.为了缓解这一问题,除了增加可用共享资源外,公平高效地管理和利用共享内存资源至关重要.在各类共享资源中,对系统性能影响最大的是共享Cache和DRAM.文中将这两级共享内存资源的分配和管理研究归结为三个重要方面,包括共享缓存分区、访存请求调度以及地址映射优化,并从优化系统吞吐率和公平性方面分析总结了一系列共享缓存分区策略,从缓解多线程对DRAM的竞争和相互干扰方面分析概括了一系列访存调度算法和地址映射策略.最后对共享内存资源未来的研究和发展做了总结和展望. 相似文献

10.

多核环境下内存数据库并发调度技术优化研究

下载免费PDF全文

游琪《计算机测量与控制》2017,25(8):234-236

对多核环境下内存数据进行并发调度,可以减少计算机宕机次数和数据切换时时间,提高数据并发调度精度,增加数据操作平稳性;当前的内存数据并发调度方法是利用PrebuiltTrigger对内存数据进行并发调度,在调度过程中,没有设定具体的内存数据调度目标,导致内存数据库中的数据因此错乱无序,存在数据并发调度精度低的问题;为此,提出一种基于Linux的多核环境下内存数据并发调度优化方法;该方法首先采用IACT算法对影响调度进行的数据和内存数据库中相似或重复数据进行清洗,然后以清洗的数据为基础,利用启发式算法对其进行数据特征选取,依据多属性决策理论对内存数据并发调度的最优路径属性权重集合进行计算,以其结果为依据,计算调度最优路径的偏差值,最后利用最小偏差值,建立调度最优路径线性规划模型,对每条调度路径的综合决策属性值进行排序,由此得到调度的最优路径,完成对多核环境下内存数据的并发调度;实验结果证明,所提方法可以对多核环境下内存数据进行高效率地并发调度,提高了数据调度精度,增加了内存数据的可循环利用性,为低开销的内存数据调度提供了支撑。相似文献

11.

分布式文件系统的流式数据预读

闫鹤李小勇胡鹏刘海涛《计算机研究与发展》2012,(Z1):252-256

在分布式文件系统中,网络和磁盘往往是影响IO性能的主要因素.如何最大限度地挖掘网络和磁盘的性能潜力,长期以来一直都是非常活跃的研究课题.已有研究工作主要侧重于预取策略和数据的缓存策略,而未能将网络和服务器端磁盘I/O统一进行调度.提出并设计实现了一种流式预读方法,通过在客户端改变发送预读请求和接收预读数据的顺序,交错网络传输和磁盘访问,实现了延迟隐藏.测试表明,这种方法确实显著提高了顺序读性能. 相似文献

12.

An efficient and comprehensive scheduler on Asymmetric Multicore Architecture systems

《Journal of Systems Architecture》2014,60(3):305-314

Several studies have shown that Asymmetric Multicore Processors (AMPs) systems, which are composed of processors with different hardware characteristics, present better performance and power when compared to homogeneous systems. With Moore’s law behavior still lasting, core-count growth creates typical non-uniform memory accesses (NUMA). Existing schedulers assume that the underlying architecture is homogeneous, and as consequence, they may not be well suited for AMP and NUMA systems, since they, respectively, do not properly explore hardware elements asymmetry, while improving memory utilization by avoid multi-processes data starvation. In this paper we propose a new scheduler, namely NUMA-aware Scheduler, to accommodate the next generation of AMP architectures in terms of architecture asymmetry and processes starvation. Experimental results show that the average speedup is 1.36 times faster than default Linux scheduler through evaluation using PARSEC benchmarks, demonstrating that the proposed technique is promising when compared to other prior studies. 相似文献

13.

分布共享存储的遥感图像并行预处理系统结构研究 总被引：1，自引：0，他引：1

下载免费PDF全文

陆松刘光明《计算机工程与科学》2004,26(10):56-59

随着遥感技术的发展,遥感图像的分辨率和采样率越来越高,对遥感图像预处理系统性能的要求也日益提高。本文介绍一种能高效实现遥感图像预处理的分布共享存储并行处理系统结构。相似文献

14.

Principles For the Design of a Distributed Memory Architecture for Parallel Graph Reduction

Bevan D. I.; Burn G. L.; Karia R. J.; Robson J. D. 《Computer Journal》1989,32(5):461-469

相似文献

15.

墓于MIPS架构的内存虚拟化研究

蔡万伟台运方刘奇张戈《计算机研究与发展》2013,50(10)

内存虚拟化是系统虚拟化中如何有效抽象、利用、隔离计算机物理内存的重要方法,决定着系统虚拟化的整体性能.传统的纯软件内存虚拟化方法会产生较大的资源开销并且兼容性差,而硬件辅助的内存虚拟化方法需要重新设计处理器硬件架构.基于MIPS架构处理器提出一种软硬件协同的内存虚拟化方法,在不增加硬件支持的情况下提高内存虚拟化性能.提出的多层虚拟地址空间模型不仅可以解决MIPS架构处理器存在的虚拟化缺陷,而且可以在已有的内存虚拟化方法上提高性能.在多层虚拟地址空间模型的基础上,提出基于地址空间标识码(address space identity,ASID)、动态划分的旁路转换缓冲(translation lookaside buffer,TLB)共享方法,降低了虚拟机切换的开销.最终,在MIPS架构的龙芯3号处理器上实现了系统虚拟机VIRT-LOONGSO)N.性能测试表明,提出的方法可以提高大多数测试程序的性能,达到二进制翻译执行性能的3～5倍,并在TLB模拟方法的基础上提高了5％～16％的性能. 相似文献

16.

基于经济模型的分布式流媒体缓存策略 总被引：1，自引：0，他引：1

下载免费PDF全文

孙名松姚亮张潇依《计算机工程》2009,35(17):64-65

为提高基于P2P技术的流媒体点播系统的服务质量,提出一种基于经济模型的分布式流媒体缓存策略,采用分布式一致性算法计算视频分段的流行度,并根据内容流行度的高低给出相应的缓存置换策略。仿真实验结果表明,该策略可以有效降低服务器的负载以及启动延时,能够获得较好的性能。相似文献

17.

流媒体应用中关键技术的研究探析

万方《计算机光盘软件与应用》2011,(2)

本文从流媒体应用支持该的流媒体编码技术和网络技术两个角度出发,针对其面临的挑战,深入、全面的综述了编码技术与网络技术的发展与现状,并指出了大规模流媒体应用中关键技术的研究方向. 相似文献

18.

系统带宽可动态扩展的流媒体系统体系结构研究 总被引：1，自引：0，他引：1

邓玉辉张江陵冯丹《小型微型计算机系统》2004,25(7):1197-1199

基于流媒体协议栈的特点，提出了一种新的高性能流媒体系统体系结构。该系统结构有效地避免了传统漉媒体系统中流媒体服务嚣和漉文件的存储系统之间大数据量的存储转发，最大程度地减小了漉媒体服务嚣的响应时间。同时，随着存储系统容量的增加，该系统所能提供的并发流的数量也随之动态增加。相似文献

19.

基于流媒体在线直播的创新课程应用 总被引：1，自引：0，他引：1

毕烨周政新韩秀玲《计算机光盘软件与应用》2012,(2):160+159

随着流媒体技术和网络技术的发展,基于流媒体技术的网络课程开始进入课程教学。教师如何运用网络组织现代化的多媒体教学?学生如何主动适应这种新的教学方式?这是高等院校进行课程改革的一个热门课题。论文结合网络技术和流媒体技术,阐述了基于流媒体的在线直播概念,提出了流媒体在线直播教学系统的构建策略以及实施方案。实践证明,通过流媒体技术在开放式课程教育中的实施,以及在大学生创新系列活动中的成功运用,既提高了学生的参与度,又有利于培养大学生的创新能力和提高教学质量。这种基于网络平台的教学方式正日益受到师生的关注和欢迎。相似文献

20.

基于对等网结构的流媒体系统研究

下载免费PDF全文

杨波廖建新朱晓民吕新荣《计算机工程》2007,33(14):192-194

提出了一种可感知拓扑的增强型、锯齿型流媒体系统结构——ZETA,设计了一种基于ZETA结构的分段流媒体内容复制与替换算法ZSDC。仿真实验表明,ZETA结构与ZSDC算法配合,提高了流媒体系统的服务质量,节省了节点的存储资源,提供了可扩展性强、性能优越、QoS良好、具有负载均衡和容错机制的流媒体服务平台。相似文献