首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 93 毫秒
1.
H.264运动估计中块模式选择的并行设计   总被引:1,自引:0,他引:1  
廖永红 《计算机科学》2008,35(9):133-135
为了方便H.264/AVC在低码率高时性应用系统中的实现,须对其编码算法进行优化.本文首先对H.264/AVC编码器进行了深入的分析,然后在此基础上提出了块模式选择的并行设计方案,并对此方案进行了并行设计与实现.最后对此设计方案在多核服务器上进行了试验.试验结果表明:并行后的三步搜索算法在不影响H.264编码质量的前提下,其编码速度平均提高了2.73倍以上.  相似文献   

2.
基于同构多核处理器的H.264多粒度并行编码器   总被引:2,自引:0,他引:2  
H.264码率低和视频质量高的优越性能以增加编码计算的复杂度为代价,如何开发适用于多核处理器平台的并行编码算法是提高其编码速度的重要研究内容,对于满足高清视频实时传输和大规模共享具有十分重要的意义.利用H.264开源编码器项目X264,在片级和数据级并行编码算法的基础上,通过分析图像帧之间的参考关系,提出并实现了B帧个数可变的帧级并行算法;根据宏块之间的参考关系,设计了一种类似流水线的宏块级并行方法;基于Intel同构多核平台,提出融合帧级、片级、宏块级和数据级4种不同粒度的并行编码方案,开发了H.264多粒度并行编码器.实验结果表明,在码率增加不大的情况下,H.264多粒度并行编码器可以很好地提升编码加速比,视频编码质量符合高质量的要求.  相似文献   

3.
针对高清视频庞大的数据量以及H.264编码器复杂的编码结构引起的低编码速率的问题,对影响算法编码速率的原因进行了深入分析,并设计了高效的多核并行方案,进而充分利用TMS320C6678的多核性能,并结合TMS320C6678的运算存储特性,对H.264编码器进行了多方面的优化,最终使H.264编码器对720P高清视频序列编码速率从1.2 fps增加到27.2 fps,更加贴近于实际应用。  相似文献   

4.
《微型机与应用》2014,(16):31-33
针对光电经纬仪高帧频和高分辨率图像实时压缩难以实现的问题,在TI公司提供的H.264单核编码开源工程和多核并行算法的基础上,提出了基于TMS320C6678多核处理器的H.264并行算法。在单核编码开源工程实现多核并行视频编码,将每帧图像平均划分成多个Slice,每个DSP核处理一个Slice。实验结果表明,与单核视频编码相比,多核并行视频编码的加速与比核数的增加呈线性增长,在TMS320C6678多核处理器上实现光电经纬仪的实时图像压缩具备较强的工程实践性。  相似文献   

5.
田韬  李鹏  张悠慧 《微计算机信息》2008,24(14):114-116
视频解码应用对硬件要求很高,随着多核处理器的普及.把解码应用在多核环境下并行以提高性能成为了一种有效的方式.文章根据H.264视频压缩标准的算法特点,分析了宏块间的数据依赖关系,设计并行流程,实现了宏块组级别的并行解码.实验结果表明,并行解码在多处理器环境下显著的提高了H.264解码性能.  相似文献   

6.
针对H.264/AVC视频编码串行算法编解码耗时长的问题,提出一种新的基于动态调度的H.264/AVC视频编码并行算法.以画面组为并行编码单元,各个并行计算单元之间采用全局通信模式,即Master-Worker模式进行互相通信,可降低并行编码的通信成本.实验结果验证了该算法在H.264/AVC视频编码应用中的优越性,能够保证视频的质量,且具有较高的编码加速比.  相似文献   

7.
结合H.264编码标准对X264编码器进行了分析与研究,目的在于提高编码速度,增强X264的实时性。在重点分析了宏块间数据依赖关系的情况下,针对帧间宏块级多线程并行编码的特点,本文提出了一种基于帧间和帧内宏块级的多线程并行编码算法。该算法在原有的帧间宏块级多线程并行编码的基础上,遵循宏块之间的空间相关性,为I帧内每行宏块创建单独的线程,实现了帧间和帧内宏块级并行编码,达到了多粒度并行的效果。实验结果表明,该算法在视频序列能够有效地编码和保持峰值信噪比变化不大的情况下,提高了编码的加速比,从而加强了视频编码的实时性。  相似文献   

8.
H.264视频编码在DM642上的实现与优化   总被引:4,自引:9,他引:4  
设计并实现了基于DSP芯片TMS320DM642的H.264编码器。详细介绍了H.264算法在DSP上的移植和优化。为使编码器达到实时应用的要求,采用基于C64xCPU的软件优化技术,对H.264的一些核心算法进行了C语言级和汇编语言级的优化,并在原算法上进行了改进,基本实现了H.264Baseline的实时编码。  相似文献   

9.
H.264视频编码标准计算复杂度较高,难以完成高清视频的实时编码。为此,提出异构多核DM6467平台的H.264并行编码算法。综合DM6467内部各个硬件加速引擎的依赖关系和存储器特点,设计宏块级并行编码算法,通过分析多slice模式流水线的特点,以及数字信号处理器和ARM双核任务分配,提出合并流水线、核间负载均衡的优化方案。实验结果表明,优化后的编码器效率提高18%,能实现在DM6467平台上1080P的实时编码。  相似文献   

10.
H.264视频编码压缩比率高,但计算复杂度高,编码效率低。该文通过分析H.264编码器中各模块的编码性能,提出了基于CUDA编程模型的H.264视频编码并行框架实现方法,对H.264视频编码的各个关键模块进行CUDA实现,有效的提高了编码的速度。  相似文献   

11.
设计了一种H.264标准的CAVLC编码器,对原有软件流程进行部分改进,提出了并行处理各编码子模块的算法结构。重点对非零系数级(level)编码模块进行优化,采用并行处理和流水线相结合的结构,减少了cavlc编码的时钟周期,提供了稳定吞吐量。采用Xilinx公司VirtexⅡ系列的xc2v250 FPGA进行实现验证,最高时钟频率可达158.1 MHz,可满足实时编码H.264高清视频要求。  相似文献   

12.
基于H.264实时编码的多核并行算法   总被引:1,自引:0,他引:1       下载免费PDF全文
冯飞龙  陈耀武 《计算机工程》2010,36(24):226-227
针对H.264多核实时编码架构,根据编码模块的数据依赖关系,提出基于相邻宏块的并行算法,融合Slice级、宏块行级和相邻宏块级并行算法,实现多粒度并行编码算法,加大了数据并行深度。实验结果表明,该并行编码算法在图像质量几乎不变的情况下能有效提高并行加速比。  相似文献   

13.
H.264视频编码软件的并行化处理   总被引:1,自引:0,他引:1  
由于视频编码的复杂性导致对计算能力的更高需求,越来越多的应用投入到视频编码的并行算法研究中。该文从H.264视频编码标准的特点出发,介绍了H.264视频编码端并行化处理:给出了并行编码器设计的主导思想,并行任务单元的选择,讨论了GOP级和Slice级的并行化处理。  相似文献   

14.
H.264作为新一代视频编码标准,具有很好的性能,但计算复杂度比较高。Storm处理器是一款面向媒体应用和信号处理的高效能流处理器,在媒体处理方面具有很好的应用前景。针对H.264对计算性能的要求,本文给出了高清H.264(1080P)变换编码在Storm-SP16 G160流处理器上的流式实现。本文根据不同算法的数据流特征,结合具体的流化过程详细介绍了并行粒度选择以及数据流组织、规范化处理等流化技术。实验结果表明:编码的流式实现具有很好的性能,按照此编码效率加速整个程序可满足实时要求。提供了一种不同于硬件加速的程序加速方法,对其他媒体应用在流处理器上的映射具有很大的借鉴意义。  相似文献   

15.
Fast Motion Estimation on Graphics Hardware for H.264 Video Encoding   总被引:1,自引:0,他引:1  
The video coding standard H.264 supports video compression with a higher coding efficiency than previous standards. However, this comes at the expense of an increased encoding complexity, in particular for motion estimation which becomes a very time consuming task even for today's central processing units (CPU). On the other hand, modern graphics hardware includes a powerful graphics processing unit (GPU) whose computing power remains idle most of the time. In this paper, we present a GPU based approach to motion estimation for the purpose of H.264 video encoding. A small diamond search is adapted to the programming model of modern GPUs to exploit their available parallel computing power and memory bandwidth. Experimental results demonstrate a significant reduction of computation time and a competitive encoding quality compared to a CPU UMHexagonS implementation while enabling the CPU to process other encoding tasks in parallel.  相似文献   

16.
为了提高H.264视频编码效率,基于计算统一设备架构(CUDA)的并行全搜索运动估计算法,并利用GPU强大的计算能力和CUDA优化的存储层次结构,以加速H.264编码中的运动估计.与传统的以牺牲视频质量来提升运动估计性能的方法不同,该算法在保证视频质量的同时,结合运动估计计算密集、计算量大等特点,充分利用CUDA架构的并行性加快运动估计的速度,从而达到提高实时编码速度的目的.在GTX280实验平台上的实验结果显示,采用文中算法比优化的CPU实现可获得高达70倍的加速比.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号