期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《计算机应用与软件》2017,(11)

针对分布式多节点多GPU的系统环境,实现一种基于CUDA框架的多GPU通用计算虚拟化平台。应用程序可以如同使用本地GPU一样方便地使用多个远程GPU,原来的CUDA应用程序可以不经过修改或者只进行少量的修改就可以运行在该虚拟化GPU平台上,从而实现单机多GPU和多机多GPU在编程模式上的统一,并通过一个基于高斯混合模型的数据聚类程序来进行实验验证。实验结果表明,在不影响程序正确性的前提下,相对于原来使用CPU的程序,使用两个远程GPU可以获得十倍左右的加速比。相似文献

2.

申威架构下的软件平滑嵌套页表

下载免费PDF全文

沙赛杜翰霖罗英伟汪小林王振林《计算机研究与发展》2022,59(4):737-746

嵌套页表是一种硬件辅助的内存虚拟化模型,当前国产申威处理器上未能提供该模型所需的硬件支持.然而申威架构特有的特权程序可编程接口可以通过软件构建必要的底层硬件支持.该接口运行在申威硬件模式上,具有最高CPU特权级.基于这一特性,在申威平台上实现了软件平滑嵌套页表模型swFNPT,通过软件设计优化弥补了硬件支持上的不足.特别地,使用平滑(1级)嵌套页表代替4级嵌套页表来提升页表查询效率.使用多组测试程序测试该设计的性能.在申威1621服务器上的实验结果表明：swFNPT整体性能良好.SPEC CPU 2006的平均内存虚拟化开销约为3%,SPEC CPU 2017中大工作集程序的平均开销约为4%,STREAM内存带宽测试结果显示swFNPT的带宽损失低于3%.这一工作可以为申威架构的硬件辅助虚拟化发展提供有价值的参考. 相似文献

3.

Jave芯片系统中的混合地址转换技术研究

陈虎戴葵《小型微型计算机系统》2001,22(3):273-277

本文首先定义了Jave芯片系统中的地址结构：对象地址、段式地址和物理地址。针对现有地址转换方法的不足,提出了一种结合段式和段页式的混合转换方法。该方法使访问对象的速度、存储空间利用率和设备复杂等方面得到合理的折衷。文中还给出了该方法在Jave芯片系统中的硬件实现方法和相关的物理存储空间分配算法,并对其进行了性能评价。相似文献

4.

不同Email系统中的地址转换

王岗《电脑技术——Hello-IT》1995,(3):21-23

Email（电子邮件）是Internet这个全球网络中最重要最基本的应用之一。在我国，它也是ChinaPac（中国分组交换网）和NCFC（theNationalComputinganaNetworainsFacilityofChina中关村科研示范网）等网络中最重要的增值服务。Email和普通邮件一样，可以传递各种信息，但更方便快捷，也更可靠。一般来说，在一份Email中，除了正文（messase，用户报文）以外，最重要的信息是邮箱地址（mailboxaddress），简称地址，一个Email系统就是根据这个地址把一讲邮件传送给指定的用户。但是Email在发展进程中出现了许多互相不完全兼容的系统，它… 相似文献

5.

桌面虚拟化系统架构研究

彭琦伟杨楚华《电脑编程技巧与维护》2015,(3):35-37

虚拟化技术的出现,使得企业得以从技术架构上根本解决移动办公问题.通过桌面虚拟化使得桌面IT系统直接升级为了面向服务的架构,一种采用虚拟化技术实现的桌面虚拟化系统架构,不仅能为企业带来了很大的资源节省和降低成本,同时使得企业的IT运维、IT服务响应、IT安全防护和移动办公能力得到飞跃性提升. 相似文献

6.

Java芯片系统中的混合地址转换技术研究

陈虎戴葵杨晓东胡守仁《小型微型计算机系统》2001,22(3):273-277

本文首先定义了Java芯片系统中的地址结构对象地址、段式地址和物理地址.针对现有地址转换方法的不足,提出了一种结合段式和段页式的混合转换方法.该方法使访问对象的速度、存储空间利用率和设备复杂度等方面得到合理的折衷.文中还给出了该方法在Java芯片系统中的硬件实现方法和相关的物理存储空间分配算法,并对其进行了性能评价. 相似文献

7.

统一渲染架构GPU图形处理量化性能模型研究

马城城田泽黎小玉孙琳娜《电子技术应用》2019,45(2)

统一渲染架构GPU为图形处理提供了丰富的运算、存储资源,也对软件优化提出了更高要求。为了有效地进行性能设计和优化,针对统一渲染架构实现的GPU提出一种量化的图形处理性能模型,在深入研究统一渲染架构GPU架构和工作原理基础上,分析影响图形处理的各种因素:图形指令生成、主机接口数据传输、图形指令解析、图形处理流水数据吞吐和统一染色阵列处理能力。通过仿真验证表明,在研制自主知识产权GPU过程中,采用本方法设计各部分性能指标,评估统一染色GPU图形处理性能与实测相比,误差小于7.5%。相似文献

8.

在线转换专用下载地址

《计算机应用文摘》2008,(15)

PCD曾经介绍了一个叫“悠饭”的网站,可以在线转换《迅雷》、《快车》、《旋风》的下载专用地址,可惜现在改版的“悠饭”上取消了这个在线转换服务。虽然现在有许多软件也可以完成专用下载地址的转换工作,但在线专用地址转换工具不受使用环境的限制,易用方便的特点是软件无法比拟的。所以这里再给大家推荐一个在线的专用地址转换网站,希望给喜爱不同下载软件的朋友带来方便。相似文献

9.

GPU虚拟化相关技术研究综述 总被引：1，自引：0，他引：1

下载免费PDF全文

余时强张为华《计算机系统应用》2017,26(12):25-31

因为计算密集型应用的增多,亚马逊和阿里巴巴等公司的云平台开始引入GPU（Graphic processing unit）加速计算. 云平台支持多用户共享GPU的使用,可以提升GPU的利用效率,降低成本;也有利于GPU的有效管理. 通过虚拟机监视器以及各种软硬件的帮助,GPU虚拟化技术为云平台共享GPU提供了一种可行方案. 本文综合分析了GPU虚拟化技术的最近进展,先根据技术框架的共同点进行分类;然后从拓展性、共享性、使用透明性、性能、扩展性等方面对比分析,最后总结了GPU虚拟化的问题和发展方向. 相似文献

10.

多数据源系统ETL架构解决方案研究

王艳明《Windows IT Pro Magazine》2007,(5):72-75

本期我们重点讨论一下基于SQL Server 2005的专业ETL工具Integration Services（SSIS）。在多数据源系统情况下的ETL架构设计问题。[编者按] 相似文献

11.

一种优化的闪存地址映射方法

张琦王林章张天邵子立《软件学报》2014,25(2):314-325

近年来,NAND闪存广泛应用于各类嵌入式系统.由于“异地更新”的限制,闪存中需要地址映射方法将来自文件系统的逻辑地址转换为闪存中的物理地址.随着闪存存储空间的日益增长,如何使地址映射表占用较小的内存而又不损失较多性能,成为一个重要的问题.基于需求的页级地址映射方法能够有效地解决这个问题,然而该方法会产生地址转换页操作的额外开销,影响系统性能.从基于需求的地址映射方法出发,从两方面进行优化：首先,为了减少转换页的频繁更新,提出了页级地址映射缓存技术以统一在闪存和内存中的地址映射信息的粒度;其次,设计了基于地址转换页的数据聚集技术.通过该技术,每个数据块在垃圾回收时产生的地址转换页的更新开销被降至最低.实验用一系列基准数据集并与之前代表性的工作进行比较,结果表明,优化的地址映射方法能够大量减少额外地址转换页的开销,并提高闪存存储系统的性能. 相似文献

12.

墓于MIPS架构的内存虚拟化研究

蔡万伟台运方刘奇张戈《计算机研究与发展》2013,50(10)

内存虚拟化是系统虚拟化中如何有效抽象、利用、隔离计算机物理内存的重要方法,决定着系统虚拟化的整体性能.传统的纯软件内存虚拟化方法会产生较大的资源开销并且兼容性差,而硬件辅助的内存虚拟化方法需要重新设计处理器硬件架构.基于MIPS架构处理器提出一种软硬件协同的内存虚拟化方法,在不增加硬件支持的情况下提高内存虚拟化性能.提出的多层虚拟地址空间模型不仅可以解决MIPS架构处理器存在的虚拟化缺陷,而且可以在已有的内存虚拟化方法上提高性能.在多层虚拟地址空间模型的基础上,提出基于地址空间标识码(address space identity,ASID)、动态划分的旁路转换缓冲(translation lookaside buffer,TLB)共享方法,降低了虚拟机切换的开销.最终,在MIPS架构的龙芯3号处理器上实现了系统虚拟机VIRT-LOONGSO)N.性能测试表明,提出的方法可以提高大多数测试程序的性能,达到二进制翻译执行性能的3～5倍,并在TLB模拟方法的基础上提高了5％～16％的性能. 相似文献

13.

Hidden productivity losses in computer systems

Yu. S. Yakovlev 《Cybernetics and Systems Analysis》2007,43(2):281-290

Based on an analysis of procedures of access to memory cells of computers and distributed computer systems (CSs), an estimate is given for time expenditures for address formation that do not belong to the category of direct expenditures for information processing in a processor and, hence, fall into the category of expenditures determining “hidden productivity losses” in a CS. Recommendations on the elimination of such losses during the creation of a CS are given. __________ Translated from Kibernetika i Sistemnyi Analiz, No. 2, pp. 147–160, March–April 2007. 相似文献

14.

VIA及其在Myrinet上的一种实现 总被引：4，自引：0，他引：4

焦振强谢军陈渝都志辉《计算机应用》2002,22(4):40-42,45

VIA是一种用户层通信模型,是当今集群系统通信的工业标准,能够提供低延迟、高带宽的数据传输,文中介绍并分析了VIA规范的产生背景和原理,并以Berkeley大学的一种实现方案为例,具体说明其实现细节。相似文献

15.

Dunbo ZHANG Chaoyang JIA Li SHEN 《Frontiers of Computer Science》2022,16(3):163104

GPUs are widely used in modern high-performance computing systems. To reduce the burden of GPU programmers, operating system and GPU hardware provide great supports for shared virtual memory, which enables GPU and CPU to share the same virtual address space. Unfortunately, the current SIMT execution model of GPU brings great challenges for the virtual-physical address translation on the GPU side, mainly due to the huge number of virtual addresses which are generated simultaneously and the bad locality of these virtual addresses. Thus, the excessive TLB accesses increase the miss ratio of TLB. As an attractive solution, Page Walk Cache (PWC) has received wide attention for its capability of reducing the memory accesses caused by TLB misses. However, the current PWC mechanism suffers from heavy redundancies, which significantly limits its efficiency. In this paper, we first investigate the facts leading to this issue by evaluating the performance of PWC with typical GPU benchmarks. We find that the repeated L4 and L3 indices of virtual addresses increase the redundancies in PWC, and the low locality of L2 indices causes the low hit ratio in PWC. Based on these observations, we propose a new PWC structure, namely Compressed Page Walk Cache (CPWC), to resolve the redundancy burden in current PWC. Our CPWC can be organized in either direct-mapped mode or set-associated mode. Experimental results show that CPWC increases by 3 times over TPC in the number of page table entries, increases by 38.3% over PWC in L2 index hit ratio and reduces by 26.9% in the memory accesses of page tables. The average memory accesses caused by each TLB miss is reduced to 1.13. Overall, the average IPC can improve by 25.3%. 相似文献

16.

MyVIA：一种基于Myrinet的VIA设计与实现

焦振强陈渝等《计算机科学》2003,30(1):27-29

1.背景近年来工业技术的进步,促进了集群技术的形成与发展,成为当今计算机技术研究的热点。在集群技术中,网络通信是很重要的一个环节,一个高效、可靠的网络通信层,是集群系统的底层基石。在集群系统中,各主机之间通信频繁,通信量大,延迟小, 相似文献

17.

部署虚拟化前需要思考的几个问题

林泽东张纯金王翀《数字社区&智能家居》2009,(11):8847-8847,8860

服务器虚拟化最近已经成为人们关注的一个焦点。了解虚拟化的应用特点,以及认识部署虚拟化前应该考虑到的问题,可以避免用户因认识错误引起的盲目投资,时实施虚拟化技术具有十分重要的意义。相似文献

18.

部署虚拟化前需要思考的几个问题

林泽东张纯金王翀《数字社区&智能家居》2009,(31)

服务器虚拟化最近已经成为人们关注的一个焦点。了解虚拟化的应用特点,以及认识部署虚拟化前应该考虑到的问题,可以避免用户因认识错误引起的盲目投资,对实施虚拟化技术具有十分重要的意义。相似文献

19.

NAT技术原理探究及在校园网上的应用实例

YAO Zheng 《数字社区&智能家居》2008,(12)

本文介绍解决私网地址的网络接入Internet问题的NAT技术,对NAT的工作原理以及4种配置NAT的具体方法进行了深入阐述,并就NAT技术在校园网中的应用作具体配置。相似文献