首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
一种新的DCT压缩域字符快速定位算法   总被引:2,自引:0,他引:2  
提出了一种基于DCT压缩域的字符定位算法,能够快速定位出具有复杂背景图像中的字符区域.该算法面向部分解码后的JPEG图像,从y分量DCT压缩码流中提取出一种新的字符/非字符分类特征,并采用自适应阈值法实现分类,利用投影法确定出字符区的位置.实验表明,该算法对不同复杂背景下的JPEG图像,可以有效实现中、英文字符区的提取,查全率和查准率可以达到90%以上,处理速度快,能够实现实时处理.  相似文献   

2.
提出了一种新的基于DCT域的MPEG-2码流转换算法,该算法与现有算法,即通过解码、空域采样率转换来设定新的码流参数,再编码的算法相比,无需IDCT、DCT操作,便可在DCT域实现码流转换,而且省去了运动矢量估值和运动补偿过程,不仅节省了大量帧存和减少了运算量,而且更具有实时性的优点,对MPEG-2 MP@ML到4:2:2Profile@ML码流转换算法实例的分析和现实表明:该算法能简单有效的实现压缩域码流转换,其思想同样可广泛用于其他基于DCT压缩图象的采样率转换、线性滤波等任务。  相似文献   

3.
提取图像内的文字信息是基于内容的检索的重要内容,通过提取后的文字能够对图像进行快速的浏览与检索,其中快速字符定位是提取图像内的文字信息的关键。论文在文献犤1犦提出的基于DCT压缩域图像字符定位算法的基础上,进一步采用自适应动态阈值及结合块间的信息对原算法进行改进。对比实验结果表明,改进的方法对图像字符定位比原方法准确率更高,漏检情况有一定程度的降低,取得了较好的效果。  相似文献   

4.
本文在尽可能少的引入额外计算和存储空间的前提下,从最大限度地利用MPEG视频压缩数据的特点进行实际应用的需求出发,研究了视频压缩域部分解码信息方法.DCT信息的部分解码是针对DCT矩阵左上角低频分量的快速解码.本文在实现MPEG-4的编解码的程序中运用了基于视频压缩域的DC+2AC部分解码信息方法并给出了采用该方法的实验效果图,同时在结合通用Intel X86处理器平台的特点的基础上改进了DC+2AC的实用快速算法,并对算法的效率进行了实验测试,结果表明在保持算法精度基本不变的情况下,运算效率得到明显提高.  相似文献   

5.
基于小波分解的快速分形图象压缩算法   总被引:1,自引:1,他引:1       下载免费PDF全文
为了解决传统分形压缩编码时间过长的问题 ,提出了一种基于小波分解的快速分形图象压缩算法 .该算法利用小波分解后各频带间能量分布不均衡的特性 ,将集中图象主要能量的低频域看作是一种图象 ,进行传统分形编码 ;然后利用小波分解后不同分辨率子带图象之间的相似性 ,用低频域的全搜索代替传统算法中整个区域的全搜索 ,将在低频域得到的分形参数进行适当的比例变换得到整幅图象的分形码 ,解码时 ,进行同传统算法相同的迭代过程 ,所得解码图象即为原图的逼近图象 .实验结果表明 ,该算法在压缩比不变 ,且基本不影响恢复图象质量的前提下 ,大大提高了编码速度 ,明显改善了分形图象压缩中编解码时间的不对称 .  相似文献   

6.
基于DCT压缩的JPEG图像的快速检索   总被引:5,自引:0,他引:5  
卞国春  张曦煌 《计算机应用》2005,25(7):1623-1625
提出了一种基于离散余弦变换(DCT)压缩的JPEC图像的检索方法。该方法利用JPEG图像数据在DCT压缩域的特性,直接提取特征,而且只需要对JPEC进行部分熵解码。在加速了图像检索的过程的同时也保证了检索结果的精确性,并且具有一定的鲁棒性。  相似文献   

7.
一种基于DCT域的图像快速检索技术   总被引:2,自引:0,他引:2  
图像视频压缩标准的出现,使得图像数据格式普遍为压缩格式,从而促进了压缩域内图像检索技术的迅速发展。DCT(Discrete Cosine Transform离散余弦变换)是目前应用最为广泛的多媒体数据压缩技术之一,直接在DCT域进行特征提取,能够避免繁琐的压缩数据编、解码操作,大大减少处理时间和处理量,节省内存空间,使得图像检索更加高效。本文首先说明了DCT变换的定义和DCT域的矩阵运算,最后着重介绍了基于DCT域图像检索技术的一种图像内容快速检索方法。  相似文献   

8.
针对车辆牌照字符这一特殊场景文本的提取,提出一种压缩域文本提取算法,它集文本区域检测、定位、跟踪和字符识别等环节于统一的框架。直接利用DCT系数可以表征图像的纹理特征这一特性,建立加权频率分量和的自适应阈值判断规则初步检测车辆牌照区域,利用分块的DC+2AC纹理值投影特征进行文本定位;利用与定位得到的文本框相交面积高于预定阈值的宏块运动矢量均值实现跟踪;在OCR识别前采用OTSU算法把车辆牌照区域图像转换为黑白二值图像。实验表明了算法的有效性,召回率与准确率分别可达95%与96.2%,该算法也适用于其他类型文本的提取。  相似文献   

9.
基于统计特征的DCT压缩域纹理图像检索方法   总被引:2,自引:1,他引:2  
提出了一种基于离散余弦变换(Discrete Cosine Transfrom,DCT)的纹理图像的检索方法.该方法在DCT压缩域,通过直接对DCT系数计算,获得图像纹理的统计特征,并作为检索的依据.理论分析和实验结果都表明,该方法具有很好的检索准确率和效率,并且对于旋转具有不变性.  相似文献   

10.
DCT域图像边缘的快速提取   总被引:4,自引:1,他引:3  
压缩域的图像分析处理技术已成为多媒体研究领域的一个热点。文中给出了DCT压缩域图像边缘的快速检测方法。该方法直接利用DCT非零系数计算图像边缘点,不需要完全解压缩,与传统象素域边缘检测方法相比,大大降低了计算复杂度,并且能根据需要提取不同精度的边缘图像。该方法在远程目标识别或基于边缘的Web图像检索等方面将能满足一定的实时性要求,具有较好的实用价值。针对JPEG图像,给出了边缘提取的实验结果,并与传统的象素域边缘检测方法进行了比较。  相似文献   

11.
Automatic caption localization in compressed video   总被引:26,自引:0,他引:26  
We present a method to automatically localize captions in JPEG compressed images and the I-frames of MPEG compressed videos. Caption text regions are segmented from background images using their distinguishing texture characteristics. Unlike previously published methods which fully decompress the video sequence before extracting the text regions, this method locates candidate caption text regions directly in the DCT compressed domain using the intensity variation information encoded in the DCT domain. Therefore, only a very small amount of decoding is required. The proposed algorithm takes about 0.006 second to process a 240×350 image and achieves a recall rate of 99.17 percent while falsely accepting about 1.87 percent nontext DCT blocks on a variety of MPEG compressed videos containing more than 2,300 I-frames  相似文献   

12.
基于DC系数和运动矢量的快速场景分割算法   总被引:1,自引:0,他引:1  
场景分割技术是动态视频分析和基于内容的视频检索的基础,以检测出来的场景作为基本单元,可以进一步对视频内容进行分析和建立索引.本文旨在提出一种基于MPEG压缩视频流的场景分割算法,利用MPEG数据流中已有的DCT DC系数和运动矢量,来检测场景的变换,从而实现场景分割,针对实际视频流中场景突变和渐变两类变换.本文提出两种方法分别处理不同情况,对于突变检测,该算法可以定位到帧,由于该算法进行最小程度的解码,降低了计算复杂度,因而大大提高了检测速度.  相似文献   

13.
鉴于数字视频在空间域及时间域上的信息相关性,提出在视频压缩过程中实现多描述编码的方法.算法以H.263为参考标准,在图块及运动估计的DCT域上进行系数划分,通过对少量重要信号的重复分配来保证单个描述的接收质量.同时,系数域的对角分割又使各个描述间具有较强的信号互补性.实验结果表明,算法具有描述冗余率低、编/解码直接快速、压缩率高等良好的MDC特性,是保障视频传输业务可靠性和实时性的有效方法.  相似文献   

14.
数据压缩技术主要用于减小视频数据的大小,以满足存储和传输的需要,但现有的图象处理技术必须先将视频压缩流完全解压后才能进行处理,本文讨论了不需要完全解压缩或仅需很小的解压就能直接对视流进行处理的方法,如MPEG压缩视频流中P帧和B帧以及常用的压缩域处理方法以及存在的问题,最后证明了在半象素运动矢量情况下MPEG简化帧抽取的准确性问题,视频压缩流在压缩域处理的特点是不仅减少了解压缩所需要的计算时间,而  相似文献   

15.
论文提出了一种工作于MPEG压缩域的快速运动目标提取算法。算法以通过部分解码得到的运动向量和亮度分量的直流DCT系数作为输入,提取P帧的运动目标。首先采用鲁棒性回归分析估计全局运动,标记出与全局运动不一致的宏块,得到运动块的分布;然后将运动向量场插值作为时间域的特征,将重构的直流图像转换到LUV颜色空间作为空间域的特征,采用快速平均移聚类找到时间和空间特征具有相似性的区域,得到细化的区域边界;最后结合运动块分布和聚类分析的结果,通过基于马尔可夫随机场的统计标号方法进行背景分离,得到运动目标的掩模。实验结果表明该算法可以有效地消除运动向量噪声的影响,并有很高的处理速度,对于CIF格式的视频码流,每秒可以处理约50帧。  相似文献   

16.
DCT域图象处理和特征提取技术   总被引:7,自引:1,他引:7       下载免费PDF全文
现今 ,大量的图象与视频信息都是以压缩数据格式进行存储和传输的 .DCT(Discrete Cosine Transform离散余弦变换 )是目前应用最为广泛的多媒体数据压缩技术之一 .直接在 DCT域实现如视频编辑、特征提取等传统空域处理技术 ,能够避免繁琐的压缩数据编、解码操作 ,减少处理时间和数据处理量 ,节省内存空间 .这一技术对于高速海量的数据处理场合 ,如 Internet信息检索、视频编辑和检索、远程监视图象的理解等 ,是很有吸引力的 ,因此其是近年来国际上有关领域的研究热点之一 .本文对近年来文献中所见的 DCT域图象处理和特征提取技术进行了回顾和综述 ,并在此基础上对其发展方向进行了探讨  相似文献   

17.
This paper presents a compressed-domain motion object extraction algorithm based on optical flow approximation for MPEG-2 video stream. The discrete cosine transform (DCT) coefficients of P and B frames are estimated to reconstruct DC + 2AC image using their motion vectors and the DCT coefficients in I frames, which can be directly extracted from MPEG-2 compressed domain. Initial optical flow is estimated with Black’s optical flow estimation framework, in which DC image is substituted by DC + 2AC image to provide more intensity information. A high confidence measure is exploited to generate dense and accurate motion vector field by removing noisy and false motion vectors. Global motion estimation and iterative rejection are further utilized to separate foreground and background motion vectors. Region growing with automatic seed selection is performed to extract accurate object boundary by motion consistency model. The object boundary is further refined by partially decoding the boundary blocks to improve the accuracy. Experimental results on several test sequences demonstrate that the proposed approach can achieve compressed-domain video object extraction for MPEG-2 video stream in CIF format with real-time performance.  相似文献   

18.
在许多实际应用中, 为了满足传输信道和终端显示设备的要求, 需要通过上采样和下采样来改变图像的尺寸. 压缩域中的图像上下采样可以在空域中进行, 然而, 直接在压缩域中实现将更为快速. 本文根据空域中块与子块的相互关系以及酉变换对矩阵乘法的分配率, 提出了 DCT 域内任意比例图像上下采样算法. 与现存的算法相比, 本算法具有较高的信噪比, 较低的运算复杂度, 并适用于帧内与帧间编码的不同情况, 可应用于不同视频编码转码的实时处理.  相似文献   

19.
With the increasing sizes of high resolution images, their storage and processing directly in the compressed domain has significantly gained importance. Algorithms for compressed domain image processing provide a powerful computational alternative to classical (pixel level) based implementations. While linear algorithms can be applied straightforward to the JPEG compressed images, this is not the case for nonlinear image processing, as for example contrast enhancement algorithms. In this paper a new implementation in the compressed domain of a very efficient contrast enhancement, based on fuzzy set modeling and on a fuzzy intensification operator, is presented. The fuzzy set parameters are adaptively chosen by analyzing the statistics of the image data in the compressed domain, in order to optimally enhance the image contrast. The nonlinear enhancement procedure requires a grey level threshold, for which an adaptive implementation, taking into account the frequency content of each coefficient block in the DCT (Discrete Cosine Transform) encoded JPEG image is proposed. This guarantees the optimal quality at minimum computational cost. The experimental results for a set of various contrast images validate the good performance and functionality of the proposed implementation.  相似文献   

20.
用 H.2 63标准对低码率图像编码时 ,编码器的复杂性主要取决于运动估计、离散余弦变换等运算 ,为了减少编码器的运算量、提高编码速度 ,提出一种有效的频域块匹配 +预判全零系数的运动估计算法。这种算法充分利用离散余弦变换的特点 ,在频域内使用块匹配法进行运动估计 ,并将预判全零系数和运动搜索相结合。实验表明该算法不仅可以有效地提高编码速度 ,而且可以较好地保持 H.2 63高压缩比及运动图像的质量等特性。本文用该算法研制了甚低码率视频编码器的软件 ,该软件编码器可以在 PSTN上实现实时编解码 ,具有较大的使用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号