共查询到19条相似文献,搜索用时 109 毫秒
1.
《计算机工程》2014,(7)
对于兼容LDPC和Turbo码的多模通信信道解码器,解码过程涉及大量数据计算和传输,系统高吞吐率的实时性要求使这类多模解码器的结构变得日益复杂。为此,设计并实现一种专用控制器,对待解码数据进行预处理,以控制整个解码器系统的工作。为满足解码器系统高时钟频率、大量专用运算和数据快速传输3个要求,采用重划分控制器流水线、增加专用指令及加速器和片内存储器划分3种方法,使解码器系统最大程度地实现并行化计算处理。测试结果表明,在专用控制器的控制协调下,解码器能满足LTE标准1 Gb/s和UMTS标准672 Mb/s的高吞吐率要求。使用TSMC 65 nm低功耗库,通过后端布局进行布线设计后,该解码器面积约为490 000μm2,最大时钟频率为540MHz。 相似文献
2.
3.
4.
5.
6.
《计算机应用与软件》2016,(12)
对Crossbar和直连结构就交换容量、吞吐率、分组延时等方面进行比较,在此基础上提出一种新型双平面路由器结构PPRA(Pigeon Pair Router Architecture)。采用转换窗口和同步可丢弃映射SDM(Synchronization Drop-able Mapping)等机制解决了振荡和分组乱序等问题。仿真结果表明,PPRA在保持吞吐率性能的情况下,比Crossbar和直连结构具有更优的分组延时性能,是一种性能较优的路由器结构。 相似文献
7.
一种高吞吐率低成本的AES协处理器设计* 总被引:1,自引:0,他引:1
设计了一种高吞吐率低成本的AES协处理器。在加解密过程中采用共享技术,S盒采用复合域算法,减少了面积的需求;在轮内设计四级流水结构,有效地缩短关键路径,从而提高了处理器的数据吞吐率;同时在密钥扩展模块内插入寄存器,保证了轮密钥与轮循环的同步。基于Virtex II Pro FPGA 芯片(90 nm工艺技术)实现该结构,消耗面积仅约2 118 slices;在最高工作频率189 MHz下,128位加密的数据吞吐率达到1.8 Gbps。与同类设计相比,该处理器吞吐率/资源消耗比值较高。 相似文献
8.
众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核协处理器上执行。使用MIC众核协处理器,采用三级并行结构及任务分配机制,提升了高吞吐率密码算法处理的并行性。针对多种密码算法应用的实验结果表明,该框架可充分利用众核平台实现粗粒度并行的高吞吐率加解密处理。 相似文献
9.
设计了一种基于H.264标准的CAVLC解码器,码流输入单元采用桶形移位器,以实现单周期解一个句法元素,在各解码模块中采用码表分割、算术逻辑替代查表、零码字跳转等关键技术,在减少路径延迟和提高系统吞吐率的同时,节省了硬件开销。整个设计采用Verilog语言实现,在XILINX的ISE8.2开发环境下通过FPGA验证,使用Design Compiler在SMIC0.18μm CMOS单元库下综合,时钟最高频率可以达到165MHz。本设计可满足实时解码H.264高清视频的要求。 相似文献
10.
11.
为解决信道译码在高吞吐量通信系统中的瓶颈问题,通过对CUDA并行计算的了解和对维特比译码并行实现的探索,为卷积码提出了一种基于CUDA的截断重叠维特比译码器。算法通过截断式的子网格图相互重叠的方式,并行执行独立的正向度量计算和回溯过程。实验结果表明,在保证了译码算法误码率性能的同时,获得了良好的吞吐量提升表现,相比现有的实现方式有1.3~3.5倍的提升,降低了硬件开销,能够有效运用于实际高吞吐量通信系统中。 相似文献
12.
13.
流水线结构RS(255,223)译码器的VLSI设计 总被引:5,自引:0,他引:5
RS码已经广泛应用于通信系统,计算机系统,存储介质,网络和数字电视中,以提高数据的可靠性;RS(255,223)码是美国航空航天局(NASA)和欧洲空间站(ESA0在深空卫星通信系统中所采用的标准外码。文中用Top-down设计方法完成了采用频域译码算法的RS(255,223)译码器的VLSI设计,提出了一个GF(256)上串行计算的流水线结构的255点IFFT,该结构的IFFT与译码器的其它模块 相似文献
14.
为提高多媒体系统中视频数据包的丢包恢复率,在传统柯西RS编码和对角交织的基础上,提出对多帧视频数据包进行二次柯西RS编码的优化算法。通过动态选取适当的柯西矩阵,用一次矩阵运算实现对视频源数据包的二次柯西RS编码,并对对角交织进行变形以适应视频数据包的特点。实验结果表明,与传统柯西RS编码算法相比,该算法在相近的解码性能、解码延时和校验包数情况下,能明显提高丢包恢复率。 相似文献
15.
16.
《中国科学:信息科学(英文版)》2012,(2):384-395
This paper presents a novel architecture of iterative receivers with two layers of iterations for turbo coded multiple-input and multiple-output orthogonal frequency-division multiplexing(MIMO-OFDM)systems,where soft messages are passed not only between the MIMO detector and the turbo decoder,but also between the two component decoders within the turbo decoder.We first derive the factor graph representation of a turbo coded system as a basic building block for developing the iterative receivers.Then,a new soft message passing schedule over the factor graph is proposed,resulting in the proposed dual-turbo receiver architecture(DTRA).In DTRA,the MIMO detector and the turbo decoder work concurrently,and the soft messages for both layers of iterations are updated instantaneously,instead of the block-based exchange of soft messages in the conventional iterative receivers.In so doing,the processing latency can be greatly reduced while low computational complexity can be achieved. 相似文献
17.
We propose a pipelined Reed-Solomon (RS) decoder for an ultra-wideband system using a modified step-by-step algorithm. To reduce the complexity, the modified step-by-step algorithm merges two cases of the original algorithm. The pipelined structure allows the decoder to work at high rates with minimum delay. Consequently, for RS(23,17) codes, the proposed architecture requires 42.5% and 24.4% less area compared with a modified Euclidean architecture and a pipelined degree-computationless modified Euclidean architecture, respectively. The area of the proposed decoder is 11.3% less than that of the previous step-by-step decoder with a lower critical path delay. 相似文献
18.
In this paper, we introduce a Turbo coded modulation scheme, called multilevel turbo coded-continuous phase frequency shift keying (MLTC-CPFSK). The underlying basis of multilevel coding is to partition a signal set into several levels and to encode separately each level through the respective layer of the encoder. In MLTC-CPFSK, to provide phase continuity of the signals, turbo encoder and continuous phase encoder (CPE) are serially concatenated at the last level, while all other levels consist of only a turbo encoder. Therefore, the proposed system contains multiple turbo encoder/decoder blocks in its architecture. The parallel input data sequences are encoded by our multilevel scheme and mapped to CPFSK signals. Then, for the purpose of performance analysis, these modulated signals are passed through AWGN and fading channels. At the receiver side, the input sequence of the first level is estimated by the first turbo decoder block. Subsequently, the other input sequences of other levels are computed using the estimated input bit streams of the respective previous levels. Simulation results are drawn for 4-ary CPFSK two level and 8-ary CPFSK three level turbo codes over AWGN, Rician, and Rayleigh channels for three iterations while frame sizes are chosen as 100 and 1024. It is concluded that satisfactory performance is achieved in MLTC-CPFSK systems for all SNR values in various fading environments. 相似文献
19.
针对视频数据在无线信道上可靠传输问题,提出了一种基于信源信道联合的最优速率分配算法。该算法在网络带宽一定的情况下,从信源、信道及差错弹性能力权衡考虑,引入了信源解码器的抗误码性能指标,根据不同的信道状态确定信源信道编码的最优速率分配方案,从而获得最大的可解码长度,并最终获取最佳重建视频质量。仿真结果表明,该方案与传统的联合信源信道速率分配算法相比可获得更高的性能增益,适合于视频数据在无线网络上传输。 相似文献