首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 625 毫秒
1.
基于循环映射的可重构处理器设计   总被引:2,自引:1,他引:1  
提出了一种适合循环任务执行的可重构处理器. 该处理器通过循环控制器实现循环的自动执行,并采用数据分发技术和不对称先进先出缓存(FIFO)技术,将可重构阵列内部数据传输效率提高8倍. 在现场可编程门阵列(FPGA)系统上验证了活动图像专家组 4的高等视频编码(H.264)中整数反离散余弦变换(IDCT)、运动估计及活动图像专家组 2(MPEG 2)中的IDCT等多种媒体核心算法. 相比于类似的结构,该可重构处理器在不增加阵列规模的情况下,性能平均提升35倍.  相似文献   

2.
基于可重构技术以及SystemC的体系结构建模特点,构建一种基于SystemC的可重构阵列处理器模型。采用模块化的SystemC系统模型分别对指令传输模块、处理元模块以及邻接互连模块建模,构成32×32的可重构阵列处理器。通过指令传输模块实现局部和非局部两种单指令多数据模式的快速切换,使用邻接互连模块完成处理元间的通信。对建立的模型进行仿真验证,同时将高效视频编解码标准中视频算法映射到该模型上。仿真结果表明,该模型搭建正确,能够实现视频编解码标准中视频算法的并行化映射。  相似文献   

3.
为满足多媒体处理等领域要求芯片高性能,且开发周期短的需求,提出一种可重构阵列DSP的结构——ReMAP.该阵列结构由多个运算单元、存储器和交换开关等级联组成,易于扩展和配置.通过把算法分割映射到多个运算单元之中,提高芯片对计算密集型任务的执行效率.在SMIC 0.18μm工艺下完成了ReMAP芯片的原型验证,包含16个ALU单元.测试结果表明,该结构能以较高效率完成如SAD和DCT等视频处理相关算法.  相似文献   

4.
基于H.264的快速运动估计和帧间模式选择算法   总被引:1,自引:0,他引:1  
H.264采用可变块尺寸的运动估计,支持多种宏块分割模式,从而使运动估计更为精确,编码效率进一步提高,但这导致了编码端计算复杂度的大幅增加.本文提出了一种基于分裂与合并的快速运动估计和帧间模式选择算法,该算法以8×8为初始块尺寸,并以8×8块进行运动搜索,在此基础上,根据块间运动向量的相关性,结合块的边缘特性完成运动估计和块模式选择.实验证明该算法能在码率和压缩质量基本不受影响的情况下极大地提高编码速度.  相似文献   

5.
提出了一种针对H.264的快速帧间模式选择算法。该算法从三个方面提高编码效率:SKIP模式提前判决;引入视频分割算法分离前景和背景,确定候选模式;提出了快速帧内模式选择方法。该算法避免了不必要的运动估计和率失真代价(RDO)的计算,节省了编码时间,同时保证了编码质量。  相似文献   

6.
为了降低高性能视频编码标准中帧间运动估计的高计算复杂度,提出了一种基于运动矢量相似性的运动估计快速终止算法.该算法利用视频序列中同一个对象的运动矢量相似性,对当前编码单元的分割方式进行了选取,提前终止了部分可能性较低的复杂分割模式的运动估计.结合运动相似区域的编码单元,在分解后的下一递归深度中对小块预测单元划分的运动估计进行了裁减.实验结果表明:所提方法与高性能视频编码标准参考代码中的标准算法相比,在低延时编码配置下,编码时间和峰值信噪比分别降低了41.79%和0.052dB.随机访问编码配置下,编码时间和峰值信噪比分别降低了41.98%和0.041dB.运动估计的计算量减小,计算复杂度降低.  相似文献   

7.
针对新型多态并行阵列机,设计一种专用处理单元。该处理单元采用四级流水线的超长指令字结构,指令系统采用无寄存器文件的直接寻址方式,加入独有的阻塞-非阻塞模式和邻接共享存储实现分布式指令并行和流处理运算,使用特殊指令完成PE间通信以及MIMD和SIMD的快速切换。实验结果表明,该处理单元能够实现运算模式分区并发执行和切换,工作最大频率可达167MHz.。  相似文献   

8.
针对H.264采用多模式运动估计和模式决策等一系列新算法而引入的高计算复杂度问题,提出了一种基于预测的H.264编码快速模式决策算法.使用一种基于自适应阈值的提早退出检测算法,以较高识别率检测出静止宏块和区域运动宏块,及早作出模式决策;对未被判定的宏块使用基于预测的快速搜索算法得到所有4×4块的运动矢量;利用自底向上合并检测,得到其他模式块的运动矢量和最佳模式.实验结果表明,该算法与参考实现中的快速算法相比,仅损失了少量的图像质量和码率,但平均编码速度提高了30%.  相似文献   

9.
研究了配置序列对部分可重构系统性能的影响,提出了在部分可重构系统配置空间中搜索最优配置序列的算法.在应用算法分割成多个任务的前提下,通过建立部分可重构系统任务执行模型,给出了任务在系统上执行代价的目标函数.根据部分可重构系统中,任务执行和配置可重叠的特性,给出了配置切换代价计算方法.在此基础上,设计了基于动态规划的配置空间搜索算法,算法可在O(nm2)(n为任务数,m为每个任务最大可选配置数)时间内搜索出执行代价最小的配置序列.结果表明,合理选择配置序列可有效提高算法在部分可重构系统上执行的效率.  相似文献   

10.
针对H.264视频转码为下一代压缩标准高效电视编码(HEVC)视频过程中耗费大量时间的问题,提出一种低复杂度的视频转码算法.该算法充分利用H.264压缩视频流中包含的信息,基于图像复杂度和编码比特数之间的关系对每帧图像进行编码复杂度分析,并根据分析结果决定编码树单元的搜索深度范围;基于HEVC码流中Skip模式与H.264码流中各种模式的映射关系对Skip模式进行提前判决,通过对编码比特数的统计分析快速选择预测单元的对称与非对称分割模式;依据运动矢量的相似性,优化了HEVC运动估计过程中预测单元的搜索起点和搜索范围,进一步减少了转码过程的计算量.实验结果表明:该算法与参考算法相比转码速度获得了大幅提高,同时还保持了几乎相同的率失真表现.  相似文献   

11.

基于率失真优化的动态可重构结构

蒋林1,张雪婷2,山蕊2,谢晓燕3,刘新闯2,贺飞龙3

(1.西安科技大学 集成电路设计实验室,西安 710054;

2.西安邮电大学 电子工程学院,西安 710121;

3.西安邮电大学 计算机学院,西安 710121)

摘要

高效视频编码(High Efficiency Video Coding,HEVC)中的率失真优化(The Rate Distortion Optimization,RDO)算法具有许多的迭代和大量的计算,为减少计算时间满足不同规模RDO算法快速切换的需求。提出一种RDO动态可重构结构。首先,通过H树型配置网络(H-tree Configurable Network,HCN)加载量化参数(Quantization Parameter,QP)和比特率值,并实时检测阵列的执行状态。当检测到RDO算法的重构请求时,下发相应的配置信息。这种硬件自适应的自重构实现方法提高了硬件的灵活性和利用率。实验结果表明:当配置网路的控制位宽度仅增加31.25%时,可控处理单元的数量增加了32倍,执行周期比同类型设计降低了50%。与其他RDO实现方法相比,在基于配置网络的可重配置阵列上实现的RDO算法的平均工作频率增加了12.5%,面积减少了56.4%。

关键词:动态可重构;速率失真优化;类似霍夫曼编码;上下文切换;视频处理

  相似文献   

12.
针对将其他格式视频转码为H.264的过程中运动估计耗费大量时间的问题,提出了一种快速运动估计算法,以实现快速转码.该算法充分利用未转码压缩视频流中包含的信息,结合时间相关预测与空间相关预测来实现MPEG-4到H.264转码过程中的多帧参考运动估计快速算法;在此基础上提出一种自适应搜索范围选择算法,以进一步减少运动估计的计算量.该算法同样适用于其他编码标准到H.264的转码.实验结果表明,该算法在图像质量和比特率方面的表现相比参考快速算法略为逊色,但转码速度有了很大的提高.  相似文献   

13.
为了提高视频图像处理速度与硬件资源利用,针对一种基于精简指令集处理器与数字信号处理器(RISC/DSP)混合体系结构的媒体处理器:浙大数芯(MD32),给出了一种软硬件协同设计策略.所给策略结合视频处理核心算法,研究分析MPEG视频编码标准的处理过程,进行了视频处理指令扩展设计,提高了数据的并行处理能力,利用了指令内并行执行特性.为有效实现扩展指令,处理器执行级采用了可扩展流水级技术.实验结果表明,指令扩展硬件成本仅占MD32的2.7%,逆离散余弦变换实现性能比MMX/SSE指令集实现的性能分别提高31%和23%,运动补偿性能比MMX指令集实现的性能提高了40%.  相似文献   

14.
讨论了计算密集型低码率视频编码算法H,263的并行性问题,根据它的数据相关性,将其分解为7个任务,对算法最费时的运动向量搜索部分提出了快速算法,针对TI的TMS320C80多媒体多处理器芯片,讨论了调度策略,最后给出了基于该芯片的实时实现结果。  相似文献   

15.
提出了一种新的快速多参考帧选择算法。用边缘检测及相关性信息确定候选参考帧集合,并利用P8×8模式下的运动矢量分布情况判断宏块的运动特性。该算法在JM10.2平台上进行了实验验证,在编码质量下降不大的情况下,大大提高了编码速度。  相似文献   

16.
动态可重构系统任务时域划分算法   总被引:2,自引:0,他引:2  
为提高动态可重构系统的执行效率,提出了一种多目标优化的动态可重构系统任务时域划分方法.在可重构硬件资源约束条件下,将任务的数据流图划分成数个子模块.使用加权方法将子模块中的操作执行时间和模块间数据通信引起的延时统一为划分代价,根据每种延时在总代价中所占比例来选取优化的方向.通过建立就绪列表的方法,避免了划分过程中出现死锁问题,保证了各个操作正常的执行顺序.实验结果表明,该方法能够有效地提高应用算法在动态可重构结构上的执行速度.算法的时间复杂度为O(|V|2+|V||E|)(其中|V|为数据流图节点数,|E|为边数).  相似文献   

17.
基于遗传算法的可重构制造单元设备布局优化方法的研究   总被引:5,自引:0,他引:5  
可重构制造单元设备布局对制造系统的物料传输、生产效率和柔性都有着重要的影响,如何设计一个具有足够柔性的设备布局一直是工业界的一个难题。本文引入了一种适用于可重构制造环境的阵列式混合布局形式,并利用遗传算法对阵列式结构的每一行进行了优化。  相似文献   

18.
本文利用具有窄带引导信号的LMS算法估计柔性天线阵各阵元的相位,能够自适应地确定时变的控制矢量,可以为动态波束形成提供阵形信息。文中提出了求解各阵元坐标的两种算法,经计算机仿真及对实际数据的处理结果表明,所用方法算法较简洁、所需条件较易得到满足,可以满足一般阵处理技术中对阵形估计的精度要求.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号