首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
单芯片多处理器(CMP)结构已成为提高微处理器性能的重要途径。本文针对多处理器系统进行了研究,介绍了多处理器系统的概念、原理、特点。围绕如何优化多处理器核的通信这一关键问题,提出了一种两两分组单信道通信的通信优化的方式,在实际开发过程中这种方法和技术被证明是有效和可行的。  相似文献   

2.
单芯片多处理器(CMP)结构已成为提高微处理器性能的重要途径。本文针对多处理器系统进行了研究.介绍了多处理器系统的概念、原理、特点:围绕如何优化多处理器核的通信这一关键问题,提出了一种两两分组单信道通信的通信优化的方式.在实际开发过程中这种方法和技术被证明是有效和可行的。  相似文献   

3.
本文提出了一个基于IBM PC/XT微机的多机系统ZDMP的系统结构设计方案。系统将各个处理机节点通过多总线(Multibus)以紧耦合方式连接起来,并带有共享存贮器作为各处理机之间通信的媒介。整个系统具有结构简单、扩展性好、可靠性高等特点。本文着重介绍ZDMP的系统结构,同时,对系统性能作了扼要的分析、评价。  相似文献   

4.
嵌入式系统在图像处理、空间计算等领域越来越广泛,如何在功耗、成本和计算能力三个主要方面取得平衡,利用多核和多处理器系统以并行计算方式提高嵌入式系统计算能力是一种有效的解决方案。意法半导体公司基于CortexM3架构的STM32系列提供FSMC总线,利用该总线系统设计一种特殊的SMP多处理器系统并进行图像算法并行化研究。实验结果分析表明,在该嵌入式多处理器平台上配合并行算法能够成倍提图像算法的运行性能。  相似文献   

5.
赵昂  王磊  梁正峰 《测控技术》2005,24(7):28-29,36
讨论了基于Infineon C167CS单片机的全数字化电梯控制系统的硬件和软件的结构,研究了在电梯控制系统中通过CAN(controller area network)总线及相关协议高效通信、协调工作的多处理器系统,设计了基于实时操作系统Keil RTX166的控制软件,提出了一种多处理器通过CAN总线通信协调工作的一种控制系统结构,以满足电梯控制中稳定性、实时性和安全性的要求.  相似文献   

6.
提出了一种面向高性能计算机的多处理器芯片组的设计,其主要特点是支持多处理器通过芯片组和交换芯片两级互连,全局地址空间和多处理器同步支持。给出了芯片组的组成结构、设计原则和关键技术,设计并实现了基于龙芯2E处理器的多处理器芯片组。目前,已采用FPGA平台对该芯片组进行验证和测试,以该芯片组为核心的四处理器原型系统完成B IOS引导和操作系统运行,经过实测处理器的访问请求通过芯片组延迟小于0.5μs,芯片组内处理器通信带宽达到500 Mbps。  相似文献   

7.
嵌入式系统在图像处理、空间计算等领域越来越广泛,如何在功耗、成本和计算能力三个主要方面取得平衡,利用多核和多处理器系统以并行计算方式提高嵌入式系统计算能力是一种有效的解决方案.讨论了基于Cortex嵌入式多处理器系统的基本结构,并在该系统上进行图像中值滤波算法的并行化研究.实验结果分析表明,在该嵌入式多处理器平台上配合并行算法能够成倍提高图像中值滤波的运行性能.  相似文献   

8.
H 􀀂 滤波在两位置对准技术中的应用   总被引:1,自引:1,他引:1  
方红  刘国燕 《传感技术学报》2005,18(4):876-879,889
对于弹载捷联惯性系统来说,快速、精确的初始对准技术是其重要的关键技术.通过分析弹载捷联惯性系统对准过程中外界干扰的随机性特点,设计一种基于 H∞滤波的两位置对准方法.采用最优两位置对准技术,改善系统的可观测性,利用 H∞鲁棒滤波技术,改善系统的鲁棒性.此外,根据实际使用环境条件,假设了三种典型干扰模型,计算机仿真结果表明,这个研究方案不仅满足了导弹快速高精度对准的要求,而且提高了系统的鲁棒性.  相似文献   

9.
介绍了一种基于FPGA的密码设备多处理器模型,结合模型的特点论述了利用这种多处理器进行协调控制的机制以及一般设计方法。对处理器相互之间的关系进行了研究与分析,同时也对从处理器与密码设备之间的通信流程进行了详细的分析和设计。针对共享资源的使用提出了一种基于双端口RAM的解决方法,提高了系统资源的利用效率。  相似文献   

10.
提出一种嵌入式异构多处理器系统的结构模型,论述这种系统的通信机制,并阐述在基于这种嵌入式异构多处理器系统模型的实时图像处理系统中,运算节点采用由TI公司的TMS320C6416 DSP芯片构造的信号处理板时,在运算节点与主控节点之间实现高速数据传输的方法,该方法极大地提高了数据的传输速度。  相似文献   

11.
Membrane systems are parallel distributed computing models that are used in a wide variety of areas. Use of a sequential machine to simulate membrane systems loses the advantage of parallelism in Membrane Computing. In this paper, an innovative classification algorithm based on a weighted network is introduced. Two new algorithms have been proposed for simulating membrane systems models on a Graphics Processing Unit (GPU). Communication and synchronization between threads and thread blocks in a GPU are time-consuming processes. In previous studies, dependent objects were assigned to different threads. This increases the need for communication between threads, and as a result, performance decreases. In previous studies, dependent membranes have also been assigned to different thread blocks, requiring inter-block communications and decreasing performance. The speedup of the proposed algorithm on a GPU that classifies dependent objects using a sequential approach, for example with 512 objects per membrane, was 82×, while for the previous approach (Algorithm 1), it was 8.2×. For a membrane system with high dependency among membranes, the speedup of the second proposed algorithm (Algorithm 3) was 12×, while for the previous approach (Algorithm 1) and the first proposed algorithm (Algorithm 2) that assign each membrane to one thread block, it was 1.8×.  相似文献   

12.
基于主机媒体流的控制与呼叫信令的应用   总被引:1,自引:0,他引:1  
对基于主机媒体流(HMP)这一新技术的控制与呼叫进行了探索性的研究。提出采用SIP和RCT协议协同完成HMP的通信控制的模式,并在该模式下着重解决了HMP下双音多频(DTMF)信令的正确识别问题,以及缩短DTMF传送时间的探索和具体方法。  相似文献   

13.
徐启迪  刘争红  郑霖 《计算机应用》2022,42(12):3841-3846
随着通信技术的发展,通信终端逐渐采用软件的方式来兼容多种通信制式和协议。针对以计算机中央处理器(CPU)作为运算单元的传统软件无线电架构,无法满足高速无线通信系统如多进多出(MIMO)等宽带数据的吞吐率要求问题,提出了一种基于图形处理器(GPU)的低密度奇偶校验(LDPC)码译码器的加速方法。首先,根据GPU并行加速异构计算在GNU Radio 4G/5G物理层信号处理模块中的加速表现的理论分析,采用了并行效率更高的分层归一化最小和(LNMS)算法;其次,通过使用全局同步策略、合理分配GPU内存空间以及流并行机制等方法减少了译码器的译码时延,同时配合GPU多线程并行技术对LDPC码的译码流程进行了并行优化;最后,在软件无线电平台上对提出的GPU加速译码器进行了实现与验证,并分析了该并行译码器的误码率性能和加速性能的瓶颈。实验结果表明,与传统的CPU串行码处理方式相比,CPU+GPU异构平台对LDPC码的译码速率可提升至原来的200倍左右,译码器的吞吐量可以达到1 Gb/s以上,特别是在大规模数据的情况下对传统译码器的译码性有着较大的提升。  相似文献   

14.
Two parallel computer paradigms available today are multi-core accelerators such as the Sony, Toshiba and IBM Cell or Graphics Processing Unit (GPUs), and massively parallel message-passing machines such as the IBM Blue Gene (BG). The solution of systems of linear equations is one of the most central processing unit-intensive steps in engineering and simulation applications and can greatly benefit from the multitude of processing cores and vectorisation on today's parallel computers. We parallelise the conjugate gradient (CG) linear equation solver on the Cell Broadband Engine and the IBM Blue Gene/L machine. We perform a scalability analysis of CG on both machines across 1, 8 and 16 synergistic processing elements and 1–32 cores on BG with heptadiagonal matrices. The results indicate that the multi-core Cell system outperforms by three to four times the massively parallel BG system due to the Cell's higher communication bandwidth and accelerated vector processing capability.  相似文献   

15.
We study the problem of minimizing the makespan for the precedence multiprocessor constrained scheduling problem with hierarchical communications (Parallel Process. Lett. 10(1) (2000) 133). We propose an -approximation algorithm for the Unit Communication Time hierarchical problem with arbitrary but integer processing times and an unbounded number of biprocessor machines. We extend this result in the case where each cluster has m processors (where m is a fixed constant) by presenting a (2−2/(2m+1))-approximation algorithm.  相似文献   

16.
提出了实现安全数据库的一种方法———数据库安全通信服务,它通过使用(1)不同种类和不同算法强度的密钥算法;(2)密钥的适时更新;(3)加密后的数据包与本地机器环境和客户端的当前用户相关;(4)数据包的还原校验与本地机器环境和客户端的当前用户相关;(5)基于X.509证书的身份识别和访问控制策略,等方法和技术极大地提高了数据库及其通信系统的安全性,具有较高的实用价值。  相似文献   

17.
Automated live video stream analytics has been extensively researched in recent times. Most of the traditional methods for video anomaly detection is supervised and use a single classifier to identify an anomaly in a frame. We propose a 3-stage ensemble-based unsupervised deep reinforcement algorithm with an underlying Long Short Term Memory (LSTM) based Recurrent Neural Network (RNN). In the first stage, an ensemble of LSTM-RNNs are deployed to generate the anomaly score. The second stage uses the least square method for optimal anomaly score generation. The third stage adopts award-based reinforcement learning to update the model. The proposed Hybrid Ensemble RR Model was tested on standard pedestrian datasets UCSDPed1, USDPed2. The data set has 70 videos in UCSD Ped1 and 28 videos in UCSD Ped2 with a total of 18560 frames. Since a real-time stream has strict memory constraints and storage issues, a simple computing machine does not suffice in performing analytics with stream data. Hence the proposed research is designed to work on a GPU (Graphics Processing Unit), TPU (Tensor Processing Unit) supported framework. As shown in the experimental results section, recorded observations on frame-level EER (Equal Error Rate) and AUC (Area Under Curve) showed a 9% reduction in EER in UCSD Ped1, a 13% reduction in ERR in UCSD Ped2 and a 4% improvement in accuracy in both datasets.  相似文献   

18.
信道建模是研究临近空间通信技术、评估系统传输特性的基础和重要方法。临近空间飞行器从低速向高速发展,信道变化频次随飞行器速度增大而愈加频繁。为实现对临空通信过程中信道衰落的实时仿真,研制基于中央处理器(Central Processing Unit,CPU)和现场可编辑门阵列(Field-Programmable Gate Array,FPGA)架构、参数1 ms更新一次的临空信道模拟器。该模拟器内置气象性损耗模型和无线信道衰落模型,CPU端通过设计状态机控制模块、优化参数计算逻辑、优化操作系统来压缩信道参数的计算时间。FPGA部分设计关键信息同步方案、基于状态机的双保障更新机制保证参数的可靠稳定传输、并行加速处理实现信息交互和增强信号处理速度。实测结果表明,上述方案有效提升了临空信道模拟器的参数计算速度和信号处理速度,可实现信道参数随收发机运动1 ms更新一次。  相似文献   

19.
20.
A new paradigm for geometric processing is proposed. The paradigm can be featured by the four key phrases: (1) Totally Four Dimensional Homogeneous Processing, (2) 4 × 4 Matrix Method and 4 × 4 Determinant Method, (3) Integer Arithmetic with Adaptive Data-Length Control Technique, (4) Systematic Paradigm Structures Based on the Duality.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号