首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 46 毫秒
1.
H.264中变换和量化的SIMD优化   总被引:4,自引:0,他引:4  
H.264是一个新的基于运动补偿+变换+量化+熵编码框架的视频编码国际标准。H.264中采用了大量的新技术,这些技术在提高编码效率的同时,也极大地增加了算法的复杂度。为此H.264在保证性能的前提下也做了一些优化,如变换和量化可以在16比特精度下完成,并且除了量化中需要少许乘法外,其余可以只用加法和移位实现。这些特点使得H.264中的变换和量化可以很好地使用支持单指令多数据(SIMD)的MMX技术进行进一步优化。该文首先介绍了H.264中变换和量化的实现过程和特点,接下来重点讨论了利用MMX指令对变换和量化中的关键部分进行优化的方法,最后给出了计算机仿真的结果,并对结果进行了分析。仿真结果表明:该文提出的方法可以使H.264的变换和量化模块的运算速度提高到原来的3.5~5.2倍,优化效果十分显著。  相似文献   

2.
H.264以其优异的压缩比率和高图像质量在实时网络视频通信、数字广播电视及高清视频存储播放等方面获得广泛应用。变换量化作为H.264编码框架中的一个基础模块,是熵编码前的一个重要处理过程,它的主要作用是使输入系数间数据相关性降低。鉴于之前大部分的变换量化是基于软件或协处理器来实现以及此种实现方式在速度及吞吐量上的局限,而硬件实现在速度和吞吐量上则具有很大的优势, 因此研究H.264变换量化的硬件实现具有实用价值。采用高速并行处理的架构,基于寄存器传输级(RTL)用硬件描述语言完成了H.264中的整数离散余弦变换(IDCT)及量化算法的实现,并用Altera公司的Cyclone Ⅱ系列可编程逻辑器件实现了硬件验证测试。设计方案消耗了10489个逻辑单元,最高工作时钟频率为184.88MHz,数据处理能力达到2958Mpixels/s,可在一个时钟周期之内完成对一个4×4矩阵数据的变换量化处理,可满足高速高吞吐量数据流处理的要求。  相似文献   

3.
基于4×4离散余弦变换的H.264量化算法   总被引:1,自引:0,他引:1  
介绍了新一代视频压缩H.264标准。该算法选择了自适应块大小变换,对误差采用基于4×4块的变换编码。  相似文献   

4.
张剑 《传感技术学报》2005,18(2):303-306
新一代视频压缩H.264标准,不同于以往的离散余弦变换(DCT),它是基于4×4离散余弦变换和量化,其算法能通过整型变换整数精确地进行计算,避免了\"逆变换误差\".执行变换系数量化过程不需要进行除法运算,只进行加法和移位运算,从而极大的降低了计算的复杂程度.  相似文献   

5.
H.264/AVC中4×4整数变换和分级量化技术对编码性能的大幅度提升起到很重要的作用,但另一方面整数变换和分级量化在编解码器中占有24%的计算复杂度。本文根据4×4残差数据块、4×4亮度DC系数块和2×2色度DC系数块整数变换的特点,提出了一种基于全零模块预判的变换与量化选择算法,通过对各种全零模块进行准确的预测从而省略对应块的变换与量化过程,达到减小计算量、简化编解码器复杂度的目的。实验结果表明,与全模式算法相比,在造成视频质量少量下降的情况下运算量减少了大约21.29%。  相似文献   

6.
基于整数变换的H.264标准量化过程*   总被引:1,自引:0,他引:1  
详细地分析了两大标准化组织最新提出的视频编码国际标准H.264中的整数变换及量化过程。H.264视频编码的基本框架类似于当前流行的视频编码标准,采用变换编码和预测编码的混合编码技术,其优异的性能来源于引入的4×4整数变换,是所有视频压缩编码标准协议中独一无二的。最后在32位超高性能的多媒体处理器TMZJ2004上进行实验,对DCT、整数变换、DCT余弦值定点三种变换编码进行了信噪比(PSNR)比较。  相似文献   

7.
H.264变换编码和量化算法的研究   总被引:4,自引:0,他引:4  
H.264是ITU和ISO联合制定的新一代视频编码标准,在多方面做出了改进。H.264标准中采用了4×4块的整数变换编码算法,有效地降低了编解码的运算量,且不存在反变换的匹配误差,精度更高。该文详细分析了整数变换编码的构造原理和H.264标准中先后采用的两种整数变换编码算法,阐述了与变换编码相关的量化过程。实验结果证明新的整数变换编码算法能够有效地提高编解码系统的整体性能。  相似文献   

8.
H.264/AVC视频压缩标准采用了4×4整数DCT变换和量化方法,避免了数据失配并提高了精度,具有较高的编码效率。本文分析H.264整数DCT变换和量化算法,将DCT变换转换为两次快速蝶形运算,减少了计算量,并用Verilog硬件描述语言编程实现整数DCT变换和量化功能,利用QuartusII进行综合和仿真,得到正确的结果。本设计具有54.54MHz的时钟频率、较低的资源消耗和功耗。  相似文献   

9.
提出了在FPGA上实现H.264中整数变换量化的方法,设计了基于动态数据宽度和流水线技术的软核(IP),在处理速度和硬件资源方面分别进行优化。此软核作为PowerPC的一个硬件加速模块在Xilinx Virtex-ⅡPRO中进行了验证。实验表明,在目前较难使用软件方法实现高分辨率图像实时编码的情况下,本文设计的软核能够提供2110MPixels/s的编码速率,完全适应实时编码。  相似文献   

10.
基于H.264/AVC视频编码标准,完成了编码模块中的4×4整数变换量化核的分析和硬件实现的优化设计。通过三种优化设计处理后,在硬件开销改变不大的情况下,使4×4整数变换量化核的最高工作频率相比优化前的30.7MHz提高了82%,达到55.8MHz,为H.264/AVC视频编码标准的硬件实现提供了参考。  相似文献   

11.
In this paper, an improved quantization technology with low-complexity is presented for H.264/AVC video codec. Multiplication factors of H.264/AVC quantizer are modified. Therefore, it is possible to reduce the bit width of the quantization and substitute large bit-width multiplier by some small bit-width adders without noticeable rate-distortion degradation in integrated circuits (ICs) design. Quantization error introduced by the modified multiplication factors is not only theoretically but also experimentally analyzed. Quantizer is optimized on register transfer level of IC design, and under the same cell CMOS technology, about 75.2% area and 76.3% dynamic power consumption are saved in each quantization unit on average compared with original H.264/AVC quantization. Experimental video coding results show that the Bjontegaard delta peak signal-to-noise ratio (PSNR) and Bjontegaard delta bit rate between the improved and original H.264/AVC quantization are very slight, which means that the improved quantization scheme is approximately the same as the original quantization scheme of H.264/AVC in rate-distortion performance.
Gangyi JiangEmail:
  相似文献   

12.
朱林  冯燕 《计算机应用》2005,25(12):2798-2799
简要介绍了单指令多数据(Single-Istruction Multiple-Data,SIMD)指令系统,并用该技术对H.264中的整数离散余弦变换(Discrete Cosine Transform,DCT)、量化、插值和运动估计等模块进行了优化,实验结果表明优化后程序的编码速率可达到30fps左右,比未优化时速度提高了6~8倍。  相似文献   

13.
在分析H.264反变换反量化算法的基础上,提出了一种高效的H.264反变换反量化硬件结构.在反变换中,采用了一个可重构的一维IDCT变换结构;在反量化中,采用了4个反量化单元的并行结构,并通过LUT取代了占用电路面积大的模运算和除法运算;在整体结构设计中,采用了门控时钟方案和流水线技术.结果表明,本设计可提高系统输出能力和降低硬件功耗,并满足1080i高清码流实时解码的要求.  相似文献   

14.
刘立冬  田翔 《计算机应用》2013,33(7):1866-1869
为了解决H.264视频信息的版权保护问题,提出了一种基于即时解码刷新(IDR)帧离散余弦变换(DCT)域的盲水印算法。该算法首先分析IDR帧的纹理特征,利用滑动矩形窗根据图像的梯度特性提取出复杂纹理区域;然后,计算该区域内每个宏块的16个4×4子块能量,得到能量最高子块;最后,通过自适应修改子块的一个交流(AC)系数幅值以达到嵌入水印的目的。实验结果表明:对CIF分辨率视频测试序列嵌入水印后,视频图像的峰值信噪比(PSNR)平均下降0.15dB,码率平均增加了0.49%,水印检测准确率达到91%以上,并且该算法能够有效抵抗不同量化参数(QP)的重复编码攻击。  相似文献   

15.
作为JPEG2000的重要组成部分,整数小波变换(IntegerWaveletTransform)和嵌入式零树编码(EmbeddedZerotreeWaveletCoding)有许多优越性,但是图象经整数小波变换(IWT)后各子带系数幅值的动态变化较小,因此其能量集中性较第一代小波变换差很多,不利于零树编码(EZW)。该文从零树编码的量化阈值入手,将传统零树编码中“2的整数次幂”量化阈值改为从1开始的整数平方量化阈值,通过缩短了各量化阈值间的距离,减少了重要系数集中出现在较低量化阈值的机会,增加了编码过程中零树的数量,从而充分利用了整数小波变换能量集中性较低的特点。实验证明,该算法通过整数平方量化阈值有效地将整数小波变换同零树编码结合起来,提高了编码效率。  相似文献   

16.
自适应补偿矢量量化   总被引:2,自引:0,他引:2  
提出了一种基于LBG码书设计的新的图像矢量量化算法。该算法利用图像信号在正交矢量空间中的能量集中性,有效地减小了码书的搜索范围,加快了矢量量化速度。同时利用原始图像和重建图像之间的差值进行了自适应补偿,在保证较高压缩比的同时,有效地克服了矢量量化的致命缺陷,即重建图像存在严重的方块效应。  相似文献   

17.
王彦明  陈波  高小明  杨程 《计算机应用》2014,34(10):2948-2952
鉴于H.264的整数离散余弦变换(DCT)算法及其量化方法复杂度高,难以直接应用于分布式视频编码(DVC)框架的现状,提出了一种基于大跨度定长(步长为2的正整数次方)量化的整数DCT算法及变换基生成方法。该算法充分地利用整数DCT基的可伸缩特性寻找最迎合硬件工作原理的变换基,在保证“小”变换基的同时将编码器的伸缩量化阶段“转移”到解码器一端以降低编码器复杂度。在“转移”过程中,该算法利用DCT系数饱和放大保证图像质量,利用DCT系数的溢出上限保证算法的可靠性,通过减小基偏差提高压缩性能。实验结果表明,与H.264对应模块相比,该算法的量化方式便于位平面提取,在图像质量达到准无损压缩的前提下将编码器的伸缩量化阶段的运算量缩减至16次整型常量加法运算,图像质量与压缩率的性价比提升了23.9%,适用于分布式编码框架。  相似文献   

18.
H.26L是新一代视频编码标准,在同等质量条件下可以比H.263 节约近50%的比特率。详细介绍了H.26L独有的特点,包括帧内预测、整数余弦变换、通用变长编码、双重扫描、多种块尺寸运动搜索、1/8像素运动估计精度等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号