首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
文中主要以一个面向神经计算的并行计算机系统NeuroC为背景,讨论一种并行计算机性能分析模型,并对NeuroC进行性能分析.根据实际并行神经计算模型、NeuroC的结构和计算特点,给出了并行神经计算中一些与性能相关的结论,最后给出了一些系统实际测试结果.  相似文献   

2.
一种通用神经计算并行模型NCPM   总被引:1,自引:0,他引:1  
戴葵  胡守仁 《计算机学报》1997,20(10):884-888
在对神经计算特点分析的基础上,本文提出一种通用的神经计算并行模型NCPM,论述了通用神经计算并行模型的定义以及神经计算并行性开发方法,并对该模型进行综合评价。  相似文献   

3.
根据基于PIM(Processor-In-Memory)技术的数据并行计算机体系结构的特点和面向多媒体计算的应用需求,提出了面向嵌入式SIMD(Single Instruction Multiple Data)计算的数据并行语言PIMC。简单讨论了PIMC语言的形式化定义,并以数据并行图像处理的均值滤波算法为例对语言的使用作了说明。结合其他大量的数据并行编程实例,说明了该语言能够在基于PIM技术的SIMD并行计算机上正确描述基本多媒体处理算法的数据并行实现。  相似文献   

4.
通过对国内外并行计算机体系结构的分析与研究,提出一种面向多媒体应用的嵌入式数据并行计算机体系结构模型,将可重构总线与PIM技术相结合,弥补传统PIM体系结构下处理元之间通信复杂度高、结构可适应性弱等不足.描述其主要部件的功能和结构,定义该体系结构计算机的指令集,通过一个典型的算法样例介绍其汇编语言程序组成和并行计算过程...  相似文献   

5.
基于Internet面向施工的并行设计咨询系统   总被引:3,自引:0,他引:3  
吴慧兰  倪中华 《计算机应用》2001,21(5):53-54,56
应用并行工程的思想和Internet技术,建立一个面向施工的并行设计咨询系统的解决方案。并对建立该系统所涉及的关键支撑技术和体系结构进行了研究,在此基础上建立了一个基于Internet面向施工的并行设计咨询系统。  相似文献   

6.
随着计算机体系结构的发展,分布式存储结构以其良好的扩展性逐渐占据了高性能计算机体系结构市场的主导地位.为了将现有的串行程序转换为能够在高性能计算机上运行的并行程序,研究人员提出了并行化编译器.然而,当前面向分布存储并行系统的编译器发展却相对较慢,而面向共享存储并行系统的编译器及其相应技术已逐渐成熟.一种开发面向分布存储并行系统编译器的可行方法是改进现有的面向共享存储并行系统的编译器,使其自动生成能够在分布存储结构高性能计算机上运行的MPI(Message Passing Interface)并行程序.因此,该文为面向共享存储并行系统的编译器Open64设计并实现了一个支持MPI代码生成的后端.根据分布式并行化编译的特点,主要从自动生成计算划分、改进循环优化和自动生成MPI并行代码3个方面对Open64进行了改进,使其能够实现面向分布存储的并行化编译.实验测试利用带有MPI后端的Open64对串行程序进行编译,生成的MPI并行代码可直接运行在具有分布存储结构的高性能计算机上.通过将该MPI并行代码的执行效率与传统面向分布存储并行系统编译器生成的MPI代码效率进行比较,并行效率有明显的提升.  相似文献   

7.
分析了目前流行的并行视频服务器体系结构:分布式结构、集群式结构、并行通用计算机结构和并行专用视频服务器结构。综合其优点,针对视频应用的特点,提出了可扩展并行视频服务器体系结构,并研制了基于该结构的并行服务系统。  相似文献   

8.
基于并行PC结构的操作系统模型研究   总被引:2,自引:0,他引:2  
1.引言并行PC是针对未来高端个人机、工作站设计的,面向实时多媒体应用的新型计算机体系结构。传统计算机采用总线结构,以主存为中心,采用集中式控制策略,其缺陷在于总线结构形成通信瓶颈,集中式控制造成控制瓶颈,成为限制计算机性能进一步提高的障碍。并行PC是针对传统计算机结构的缺陷,综合考虑  相似文献   

9.
针对多片TMS320C64 DSP构成的多计算机体系结构的实时图像识别系统,设计并实现了面向并行图像处理的实时分布式操作系统PIPORTDOS(Parallel image processing-oriented real-time distributed operating system).PIPORTDOS基于微内核体系结构,包括硬件抽象层、系统核心层、分布式消息通信机制和系统服务层四个层次.其多任务内核实现了基于优先级的抢先式调度、任务闻的同步和通信原语、实时的中断处理以及面向应用的缓存管理机制.为了实现对分布式并行图像处理的支持,PIPORTDOS采用了基于消息传递(Message Passing)的方式,并在实现中充分考虑了上层图像处理算法的应用需求以及DSP的硬件功能.相关性能指标表明,本文设计实现的PIPORTDOS完全可以满足系统的强实时性要求.在功能上也能适应算法对不同并行结构的需求.  相似文献   

10.
一种面向并行工程的设计过程管理体系结构   总被引:2,自引:0,他引:2  
本文提出了一种基于计算机支持的协同工作面向并行工程的设计过程管理体系结构,它既有有效地支持并行设计,也可支持顺序设计。由于不同类型目标数据的设计过程的管理工作各不相同,为此引入了设计过程模糊板和触发事件的概念,以定义设计过程中不可预料的管理活动。  相似文献   

11.
通用可伸缩并行神经计算机系统NeuroC的设计和实现   总被引:1,自引:0,他引:1  
NeuroC是一个通用的并行神经网络计算机系统,它的规模是可以伸缩的,针对神经计算,系统设计了一套具有可选择广播通信能力的非等时访问共享存储器系统,本文首次对神经计算的需求进行了分析,接着讨论了计算单元的选择,存储器的组织与通信的实现,儋后介绍了系统硬件的主要结构,文章中还简要地阐述了系统中软件的组成和结构,最后本文对NeuroC的特点进行了总结。  相似文献   

12.
孔超  李占才  王沁  李昂  钱艺 《计算机工程》2007,33(19):236-237
分析了SOM神经网络算法在FPGA实现过程中要考虑的2个主要问题:并行性和有限字长效应。通过分析,提出了一种实现该算法的高并行体系结构并给出了该体系结构中关键模块的具体实现电路。根据计算机仿真以及在FPGA上的实现所得到的结果表明,该体系结构在保证神经网络性能的同时,可以使电路具有较高的处理速度。  相似文献   

13.
虚拟环境的系统设计方法及计算模型研究   总被引:11,自引:0,他引:11  
面向对象技术和面向Agent技术是虚环境系统的基本设计方法。本文用面向对象的方法来构造Agent,并提供一组支撑Agent的底层计算模型,如神经网络,遗传算法,专家系统和规划管理等。  相似文献   

14.
深度神经网络DNN模型是人工神经网络ANN模型的重要分支,是深度学习的基础。近年来,由于计算机算力的提升和高性能计算技术的发展,使得通过增加DNN网络深度和模型复杂度来提高其特征提取和数据拟合的能力成为可能,从而使DNN在自然语言处理、自动驾驶和人脸识别等问题上显现了优势。然而海量的数据和复杂的模型大大提高了深度神经网络的训练开销,因此加速其训练过程成为了一项关键任务,其技术范围涵盖从底层电路设计到分布式算法设计等多个方面。国产天河三号原型机峰值速度的设计目标为百亿亿级,巨大的计算能力为DNN训练提供了潜在的契机。针对天河三号原型机ARM架构特点,采用PyTorch框架与MPI技术,针对单个MT-2000+计算节点、单个FT-2000+计算节点,以及通过拓展的多节点集群设计CNN训练策略,并对上述处理器在神经网络分布式训练的性能做出了评测和优化,为进一步提升和改进天河三号原型机在神经网络大规模分布式训练方面的表现提供了实验数据和理论依据。  相似文献   

15.
脉冲神经网络属于第三代人工神经网络,它是更具有生物可解释性的神经网络模型。随着人们对脉冲神经网络不断深入地研究,不仅神经元空间结构更为复杂,而且神经网络结构规模也随之增大。以串行计算的方式,难以在个人计算机上实现脉冲神经网络的模拟仿真。为此,设计了一个多核并行的脉冲神经网络模拟器,对神经元进行编码与映射,自定义路由表解决了多核间的网络通信,以时间驱动为策略,实现核与核间的动态同步,在模拟器上进行脉冲神经网络的并行计算。以Izhikevich脉冲神经元为模型,在模拟环境下进行仿真实验,结果表明多核并行计算相比传统的串行计算在效率方面约有两倍的提升,可为类似的脉冲神经网络的模拟并行化设计提供参考。  相似文献   

16.
面向客户/服务器计算的网络体系结构模型   总被引:3,自引:0,他引:3  
本文首先分析了客户/服务器计算(简称C/S计算)的特点及对网络技术的要求,然后针对C/S计算的特点提出结构化C/S计算网络体系的结构SCSNA,并论述SCSNA的关键技术,最后讨论了SCSNA模型在具体的客户/服务器计算环境下的表现形式。  相似文献   

17.
基于神经网络集成的肺癌早期诊断   总被引:3,自引:0,他引:3  
将病理性诊断与计算机技术相结合以实现肺癌的早期诊断,首先利用数字图像技术对肺癌穿刺样本进行处理,提出取形态和色度特征,然后通过一种二级集成结构和特殊的投票方式,用神经网络集成对细胞图象进行分析,实验和原型系统试用表明,方法的总误诊率和肺癌患者漏诊率均低于单一神经网络方法和常用的神经网络集成方法。  相似文献   

18.
并行应用程序的远程实时跟踪可视化系统的设计及实现   总被引:2,自引:0,他引:2  
并行应用程序的远程实时跟踪可视化技术通过实现对并行应用程序的实时监控,帮助科研人员更进一步地了解和控制并行数值模拟的计算过程.介绍一个面向并行应用程序的远程实时跟踪可视化系统.该系统远程实时访问运行在分布存储并行机上的并行程序中的变量,将计算的中间结果实时地显示在客户端图形工作站上,从而实现程序的远程实时跟踪.从设计目标、体系结构及其实现等几个方面来介绍该系统,着重讲述该系统中的核心部分——数据传输模块的实现,详细阐述该模块实现过程中所采用的分布类型数据的位置索引及同步访问机制等关键技术.  相似文献   

19.
管惠维 《软件学报》1996,7(2):111-118
人工神经网络模型的软件模拟,其并行算法的设计、实现及性能评价对于神经网络计算机和各种专用神经网络VLSI芯片的研制具有十分重要的意义.本文首先构造了一个分布式存储器、信息传递方式的多机系统作为软件模拟人工神经网络的平台,并用一个环拓扑结构的多Transputer网络予以实现.接着提出并实现了一个适用于动态环拓扑形式的DBP并行计算模型,它主要包括神经元的划分和映射策略;DBP中活性值、误差反向传播及权值修改的多机并行算法.然后讨论该DBP算法的时间复杂度和加速比.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号