共查询到18条相似文献,搜索用时 46 毫秒
1.
H.264中变换和量化的SIMD优化 总被引:4,自引:0,他引:4
H.264是一个新的基于运动补偿+变换+量化+熵编码框架的视频编码国际标准。H.264中采用了大量的新技术,这些技术在提高编码效率的同时,也极大地增加了算法的复杂度。为此H.264在保证性能的前提下也做了一些优化,如变换和量化可以在16比特精度下完成,并且除了量化中需要少许乘法外,其余可以只用加法和移位实现。这些特点使得H.264中的变换和量化可以很好地使用支持单指令多数据(SIMD)的MMX技术进行进一步优化。该文首先介绍了H.264中变换和量化的实现过程和特点,接下来重点讨论了利用MMX指令对变换和量化中的关键部分进行优化的方法,最后给出了计算机仿真的结果,并对结果进行了分析。仿真结果表明:该文提出的方法可以使H.264的变换和量化模块的运算速度提高到原来的3.5~5.2倍,优化效果十分显著。 相似文献
2.
H.264以其优异的压缩比率和高图像质量在实时网络视频通信、数字广播电视及高清视频存储播放等方面获得广泛应用。变换量化作为H.264编码框架中的一个基础模块,是熵编码前的一个重要处理过程,它的主要作用是使输入系数间数据相关性降低。鉴于之前大部分的变换量化是基于软件或协处理器来实现以及此种实现方式在速度及吞吐量上的局限,而硬件实现在速度和吞吐量上则具有很大的优势, 因此研究H.264变换量化的硬件实现具有实用价值。采用高速并行处理的架构,基于寄存器传输级(RTL)用硬件描述语言完成了H.264中的整数离散余弦变换(IDCT)及量化算法的实现,并用Altera公司的Cyclone Ⅱ系列可编程逻辑器件实现了硬件验证测试。设计方案消耗了10489个逻辑单元,最高工作时钟频率为184.88MHz,数据处理能力达到2958Mpixels/s,可在一个时钟周期之内完成对一个4×4矩阵数据的变换量化处理,可满足高速高吞吐量数据流处理的要求。 相似文献
3.
4.
新一代视频压缩H.264标准,不同于以往的离散余弦变换(DCT),它是基于4×4离散余弦变换和量化,其算法能通过整型变换整数精确地进行计算,避免了\"逆变换误差\".执行变换系数量化过程不需要进行除法运算,只进行加法和移位运算,从而极大的降低了计算的复杂程度. 相似文献
5.
H.264/AVC中4×4整数变换和分级量化技术对编码性能的大幅度提升起到很重要的作用,但另一方面整数变换和分级量化在编解码器中占有24%的计算复杂度。本文根据4×4残差数据块、4×4亮度DC系数块和2×2色度DC系数块整数变换的特点,提出了一种基于全零模块预判的变换与量化选择算法,通过对各种全零模块进行准确的预测从而省略对应块的变换与量化过程,达到减小计算量、简化编解码器复杂度的目的。实验结果表明,与全模式算法相比,在造成视频质量少量下降的情况下运算量减少了大约21.29%。 相似文献
6.
基于整数变换的H.264标准量化过程* 总被引:1,自引:0,他引:1
详细地分析了两大标准化组织最新提出的视频编码国际标准H.264中的整数变换及量化过程。H.264视频编码的基本框架类似于当前流行的视频编码标准,采用变换编码和预测编码的混合编码技术,其优异的性能来源于引入的4×4整数变换,是所有视频压缩编码标准协议中独一无二的。最后在32位超高性能的多媒体处理器TMZJ2004上进行实验,对DCT、整数变换、DCT余弦值定点三种变换编码进行了信噪比(PSNR)比较。 相似文献
7.
H.264变换编码和量化算法的研究 总被引:4,自引:0,他引:4
H.264是ITU和ISO联合制定的新一代视频编码标准,在多方面做出了改进。H.264标准中采用了4×4块的整数变换编码算法,有效地降低了编解码的运算量,且不存在反变换的匹配误差,精度更高。该文详细分析了整数变换编码的构造原理和H.264标准中先后采用的两种整数变换编码算法,阐述了与变换编码相关的量化过程。实验结果证明新的整数变换编码算法能够有效地提高编解码系统的整体性能。 相似文献
8.
H.264/AVC视频压缩标准采用了4×4整数DCT变换和量化方法,避免了数据失配并提高了精度,具有较高的编码效率。本文分析H.264整数DCT变换和量化算法,将DCT变换转换为两次快速蝶形运算,减少了计算量,并用Verilog硬件描述语言编程实现整数DCT变换和量化功能,利用QuartusII进行综合和仿真,得到正确的结果。本设计具有54.54MHz的时钟频率、较低的资源消耗和功耗。 相似文献
9.
10.
11.
In this paper, an improved quantization technology with low-complexity is presented for H.264/AVC video codec. Multiplication
factors of H.264/AVC quantizer are modified. Therefore, it is possible to reduce the bit width of the quantization and substitute
large bit-width multiplier by some small bit-width adders without noticeable rate-distortion degradation in integrated circuits
(ICs) design. Quantization error introduced by the modified multiplication factors is not only theoretically but also experimentally
analyzed. Quantizer is optimized on register transfer level of IC design, and under the same cell CMOS technology, about 75.2%
area and 76.3% dynamic power consumption are saved in each quantization unit on average compared with original H.264/AVC quantization.
Experimental video coding results show that the Bjontegaard delta peak signal-to-noise ratio (PSNR) and Bjontegaard delta
bit rate between the improved and original H.264/AVC quantization are very slight, which means that the improved quantization
scheme is approximately the same as the original quantization scheme of H.264/AVC in rate-distortion performance.
相似文献
Gangyi JiangEmail: |
12.
简要介绍了单指令多数据(Single-Istruction Multiple-Data,SIMD)指令系统,并用该技术对H.264中的整数离散余弦变换(Discrete Cosine Transform,DCT)、量化、插值和运动估计等模块进行了优化,实验结果表明优化后程序的编码速率可达到30fps左右,比未优化时速度提高了6~8倍。 相似文献
13.
14.
为了解决H.264视频信息的版权保护问题,提出了一种基于即时解码刷新(IDR)帧离散余弦变换(DCT)域的盲水印算法。该算法首先分析IDR帧的纹理特征,利用滑动矩形窗根据图像的梯度特性提取出复杂纹理区域;然后,计算该区域内每个宏块的16个4×4子块能量,得到能量最高子块;最后,通过自适应修改子块的一个交流(AC)系数幅值以达到嵌入水印的目的。实验结果表明:对CIF分辨率视频测试序列嵌入水印后,视频图像的峰值信噪比(PSNR)平均下降0.15dB,码率平均增加了0.49%,水印检测准确率达到91%以上,并且该算法能够有效抵抗不同量化参数(QP)的重复编码攻击。 相似文献
15.
作为JPEG2000的重要组成部分,整数小波变换(IntegerWaveletTransform)和嵌入式零树编码(EmbeddedZerotreeWaveletCoding)有许多优越性,但是图象经整数小波变换(IWT)后各子带系数幅值的动态变化较小,因此其能量集中性较第一代小波变换差很多,不利于零树编码(EZW)。该文从零树编码的量化阈值入手,将传统零树编码中“2的整数次幂”量化阈值改为从1开始的整数平方量化阈值,通过缩短了各量化阈值间的距离,减少了重要系数集中出现在较低量化阈值的机会,增加了编码过程中零树的数量,从而充分利用了整数小波变换能量集中性较低的特点。实验证明,该算法通过整数平方量化阈值有效地将整数小波变换同零树编码结合起来,提高了编码效率。 相似文献
16.
17.
鉴于H.264的整数离散余弦变换(DCT)算法及其量化方法复杂度高,难以直接应用于分布式视频编码(DVC)框架的现状,提出了一种基于大跨度定长(步长为2的正整数次方)量化的整数DCT算法及变换基生成方法。该算法充分地利用整数DCT基的可伸缩特性寻找最迎合硬件工作原理的变换基,在保证“小”变换基的同时将编码器的伸缩量化阶段“转移”到解码器一端以降低编码器复杂度。在“转移”过程中,该算法利用DCT系数饱和放大保证图像质量,利用DCT系数的溢出上限保证算法的可靠性,通过减小基偏差提高压缩性能。实验结果表明,与H.264对应模块相比,该算法的量化方式便于位平面提取,在图像质量达到准无损压缩的前提下将编码器的伸缩量化阶段的运算量缩减至16次整型常量加法运算,图像质量与压缩率的性价比提升了23.9%,适用于分布式编码框架。 相似文献
18.
H.26L是新一代视频编码标准,在同等质量条件下可以比H.263 节约近50%的比特率。详细介绍了H.26L独有的特点,包括帧内预测、整数余弦变换、通用变长编码、双重扫描、多种块尺寸运动搜索、1/8像素运动估计精度等。 相似文献