首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
为提高分子动力学模拟中短程力的计算效率,设计并实现了基于FPGA的分子动力学模拟短程力多流水计算系统。针对在短程力多流水计算过程中多个计算模块频繁调用大量的粒子信息导致的高带宽需求和访问内存冲突问题,提出了多流水数据预取系统的设计,可减少对粒子数据的重复读取,缓解访问冲突,保证计算模块的效率。本文使用Xilinx Virtex UltraScale+HBM VCU128 FPGA开发板,实验结果表明,与短程力单流水计算系统相比,短程力多流水计算系统的计算效率提高了3.29倍,同时验证了多流水数据预取系统的有效性。  相似文献   

2.
为减少分子动力学模拟中短程力计算的时间消耗,设计并实现基于现场可编程门阵列的分子动力学模拟匹配单元。理论上,分析了分子动力学模拟中粒子间作用力的物理规律,提出两种满足短程力计算要求的粒子对的筛选方法:偏序法和平面法。技术上,使用新兴的硬件描述语言SpinalHDL,在Xilinx Virtex UltraScale+ HBM VCU128 FPGA板卡上实现了匹配单元。最后,将硬件测试结果与理论结果进行对比,验证了匹配单元可以有效过滤掉对短程力计算没有贡献的粒子对。同时对使用偏序法、平面法和使用直接计算法两种不同情况下的资源消耗进行对比分析,表明使用偏序法、平面法可以节省系统70%的DSP资源。  相似文献   

3.
FPGA传统RTL级别开发有着较高的编程难度和较长的设计时间,这限制了FPGA在分子动力学模拟中的应用.本文使用FPGA新一代编程方案HLS,基于Alevo U50板卡设计并实现了基于可重构计算平台硬件的分子动力学短程非键成力加速器,分别从粒子配对器设计优化、计算流水线设计等方面出发,设计具有高效率、低能耗的可重构计算方法.同时针对非键成力计算中存在的动态数据流,提出了HLS+ HDL的设计方法,进而在极大缩减设计时间的同时保证加速器的性能.  相似文献   

4.
针对常见的图像预处理系统中由上位机实现图像预处理的过程。利用FPGA并行处理的特点,提出了将基于摄像头的图像获取与基于FPGA的图像预处理技术相结合的方法。在图像获取阶段,通过摄像头进行图像数据的获取并将图像数据传输给SDRAM存储,同时在FPGA中实现图像预处理,以及使用以太网将图像数据传输给上位机,最终实现图像获取、预处理与传输。仿真结果表明,该方法相较于传统的图像预处理与传输方法能够实现稳定,实时的图像预处理与传输。  相似文献   

5.
为了满足高精度软件接收机对卫星导航中频信号传输系统的新要求,设计了一种基于PCIe总线的传输系统.该系统以Virtex-5 FPGA为核心控制器件,以DMA方式通过4通道PCIe接口传输导航卫星数据.详细介绍传输系统AD模块、DMA控制模块、中断模块等核心模块的FPGA实现方法.经过测试与验证,系统读写速率分别达到了800 MB/s和650 MB/s,可以满足不同层次导航软件接收机对原始导航数据的需求.  相似文献   

6.
为了克服现场数据采集远程传输问题,提出了一种基于FPGA的远程光通讯数据采集系统,实现了远程传输现场采集数据.该系统采用了ADC+FPGA+光通讯模块的实现方案,在对系统总体设计进行阐述的基础上,描述了各个主要电路的设计方法.  相似文献   

7.
文章设计了一种基于运动检测的FPGA远程图像采集与存储系统,并给出了系统整体设计方案和核心的运动检测模块的具体实现方法。该系统主要由图像采集模块,运动检测模块,图像存储模块以及网络接入模块组成。该设计在FPGA多媒体开发平台EP2C70的基础上添加基于LAN91C111的网络接入模块来实现,利用Verilog语言在该平台上具体实现运动检测算法。试验证明该系统可以快速并智能化采集图像信息,快速的检测异常运动物体,采集的图像信息被实时存储或者通过网络接入模块实现远程传输。  相似文献   

8.
介绍了一种基于FPGA与USB2.0的双通道实时数据采集与处理系统。该系统采用XC3S1200E芯片作为核心处理芯片,CY7C68013作为USB接口芯片,通过FPGA内部的控制模块控制A/D数据转换和USB的数据传输,并在FPGA内部完成数据的处理。实验证明,该系统基本能满足设计的要求。计算出所求粒子的直径。  相似文献   

9.
《微型机与应用》2017,(24):98-101
针对数字信号处理系统前端数据采集与后端信号处理之间的数据流传输效率问题,介绍了基于RapidIO协议和Aurora协议在FPGA上实现高速数据交换的设计方案。该交换模块采用Aurora协议与光纤传输结合实现高速数据采集的点到点通信,并利用RapidIO协议的高效率解决数据高速交换问题。验证结果表明该方法在数据传输效率上达到了预先设计指标,其对提高数字信号处理系统处理带宽、改进系统性能具有较大的意义。  相似文献   

10.
介绍了基于FPGA及AD9224的高速数据采集系统。该设计用AD9224来实现AD转换,用FPGA实现控制逻辑,用FIFO作为AD转换与FPGA之间的高速缓冲存储区。实现了高速数据采集、数据的快速传输和模块灵活控制三者的结合。FPGA模块设计使用VHDL语言编写,用MAXPLUS实现软件设计和仿真验证。  相似文献   

11.
耗散粒子动力学(DPD)模拟是一种重要的研究流体动力学特性的计算模拟方法,基于Intel MIC平台设计实现了面向大规模耗散粒子动力学模拟,充分结合了DPD模拟本身的特性和MIC平台的特征。对DPD模拟中的近邻列表构建和短程作用力关键代码实现了向量化优化,在CPU和MIC协处理器之间采用任务计算负载平衡机制,支持MPI进程内线程数量负载平衡控制。分别在原型程序上和LAMMPS集成中做了性能对比分析,实验结果显示了引入相关优化技术的有效性,为进一步研究面向MIC众核平台的分子动力学相关工作奠定了基础。  相似文献   

12.
田卓  陈一峯 《软件学报》2021,32(9):2945-2962
“神威·太湖之光”国产超级计算机的特点是适用于高通量计算系统,此类系统往往存储器访问延迟,网络延迟较长.在实际应用中,有一大类问题是时间演化的模拟问题,往往需要高频状态迭代,每次迭代需要通信.此类应用问题的典型代表是分子动力学模拟,分子的性质依赖于时间演化,导致状态相关的时间尺度上难以并行化.实际应用中,全原子模型需要模拟超过ms时间尺度,每一步的物理时间为1fs~2.5fs,这意味着所需时间步个数超过1012个.众核处理器中,不同核心访存时需较长的“排队”等待,造成访存延迟.另外,网卡通信延迟以及较长的数据通路会带来网络延迟,由此导致在长延迟的众核处理器上进行一次有效的模拟几乎是不可能的.解决此类问题的主要挑战是提高迭代频率,即每秒执行尽可能多的迭代步.针对神威高性能芯片处理器的体系结构特点,以分子动力学模拟为例,研究了一系列优化策略以提高迭代频率:(1)单核通信与片上核间同步相结合,降低通信成本;(2)共享内存等待与从核同步相结合,优化异构体系结构中的核间同步;(3)改变计算模式,减少核间数据关联和依赖关系;(4)数据传输与计算重叠,掩盖访存延迟;(5)规则化问题,以提高访存凝聚性.  相似文献   

13.
为解决有源电力滤波器在现场工作中的准确监测与可靠控制问题,设计并实现了一种基于DSP28335的有源电力滤波器测控系统.主要对数据采集模块、通信模块、人机交互模块的硬件电路进行了详细介绍,对监测参数计算、SPI通信、故障处理的软件功能进行了阐述,给出了硬件结构和软件流程.实验结果表明系统满足设计要求,实现了对有源电力滤波器实时准确监测并可靠控制的目的.  相似文献   

14.
基于Unity3D的多平台虚拟校园设计与实现   总被引:1,自引:0,他引:1  
张典华  陈一民 《微机发展》2014,(2):127-130,135
针对当前虚拟现实开发速度慢、成本高、交互性能差、平台移植难等问题,利用Unity3D进行了上海大学嘉定校区虚拟校园的开发。为加快计算速度并提高交互性,利用多边形简化技术来表现层次细节纹理,实现了三个层次的细节模型。使用动态遮挡技术建立了三维的遮挡区域,而且置于人物摄像机的视域之内,可以在人物移动时剔除不需要显示的模型,减少了计算量。利用椭圆体代替粒子,并建立了椭圆体粒子发射器、粒子动画器、粒子渲染器来表现粒子系统。同时对摄像机跟随、碰撞检测等问题进行了研究和实现。完成了校园漫游模块、虚拟展厅模块、小孩扔书游戏模块、男运动员投篮仿真训练模块。最后将虚拟校园移植到多个平台上,系统运行流畅,达到了设计要求。  相似文献   

15.
With advances in reconfigurable hardware, especially field-programmable gate arrays (FPGAs), it has become possible to use reconfigurable hardware to accelerate complex applications such as those in scientific computing. There has been a resulting development of reconfigurable computers, that is, computers that have both general-purpose processors and reconfigurable hardware, as well as memory and high-performance interconnection networks. In this paper, we describe the acceleration of molecular dynamics simulations with reconfigurable computers. We evaluate several design alternatives for the implementation of the application on a reconfigurable computer. We show that a single node accelerated with reconfigurable hardware, utilizing fine-grained parallelism in the reconfigurable hardware design, is able to achieve a speedup of about two times over the corresponding software-only simulation. We then parallelize the application and study the effect of acceleration on performance and scalability. Specifically, we study strong scaling, in which the problem size is fixed. We find that the unaccelerated version actually scales better, because it spends more time in computation than the accelerated version does. However, we also find that a cluster of P accelerated nodes gives better performance than a cluster of 2P unaccelerated nodes.  相似文献   

16.
Data transmission network integration is one of the most difficult problems to solve in wireless sensor network systems. ZigBee and Wi-Fi belong to different network protocols. If a network system must use both ZigBee and Wi-Fi at the same time to transmit data a considerable challenge is presented. This paper introduces a novel hardware method that integrates ZigBee and Wi-Fi. The proposed method is based on the Arduino wearable module ZigBee and Ethernet concept. This study builds an intelligent home appliance control system using the ZigBee network. This intelligent control system uses an integrated ZigBee and Wi-Fi network architecture in the house. Our study sends the ZigBee sensor messages to a cloud database through the TCP/IP protocol network containing the physical network and wireless network device lines. Control management access is achieved using smart phones. The proposed method is very simple and easy to implement using Arduino circuits. The effectiveness of the proposed method is verified by the simulation and experimental results. The hardware components include the Arduino controller, XBee Series 2 wireless communication module and end device sensors. The Android and Java programming languages are used to write the smart phone and Server recognition programs.  相似文献   

17.
明显诚  许博 《测控技术》2014,33(12):88-91
针对目前导航系统非隐蔽性、抗干扰能力弱、机动性不高,以及对精确定位信息加密等问题进行分析研究,设计能够接收多种卫星系统信息的车载定位导航系统,可实现精确定位,减少定向误差,并具备所需的加密和隐蔽特性。以接收模块和计算模块为核心部件,实现复杂的信号接收、计算和显示功能。介绍了系统总体布局、相关硬件电路和软件结构。实践证明该系统可有效解决上述难题。  相似文献   

18.
传统机器人步态控制系统对路线把握能力不强,导致对机器人步态的控制精度较差、时间过长。为解决上述问题,基于CARLA-PSO组合模型设计了一种新的机器人步态控制系统。硬件部分挑选操作性能较高的硬件元件系统,精准掌控系统中心点的位置,并在此位置上加大数据研究力度,通过数据监视模块及数据控制模块获取的数据结果,利用目标参数控制模块实施数据处理操作;以收集的硬件信息作为软件操作基础,利用CARLA-PSO组合模型得出机器人步态控制局部及全局最优解,综合运用软件控制算法整合获取的步态信息,调控路径信息,结合传感角信息,清理无关步态数据,完成机器人步态控制系统设计。实验结果表明,基于CARLA-PSO组合模型的机器人步态控制系统能够更精准地把控路线,相较于传统控制系统,设计的系统控制时间提高了15.2%,具有较好的控制效果。  相似文献   

19.
设计小型飞艇自驾仪的硬件在回路仿真平台,包括建立基于嵌入式系统ARM9的飞控系统验证机,采用分层结构方式的导航与控制模块。同时构建小型飞艇的动力学、压控系统和传感器仿真模型,充分发挥硬件在回路仿真测试系统软硬件结合的特点,缩短研发周期,提高系统可靠性。仿真结果表明了该平台的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号