共查询到20条相似文献,搜索用时 31 毫秒
1.
马晓婷 《数字社区&智能家居》2011,(19)
行人跟踪是当前机器视觉中非刚性运动目标跟踪领域的热点问题,将这一问题分为行人检测和行人跟踪两大部分,并对其进行了详细介绍。分析了不同的检测和跟踪方法,对行人跟踪中存在的疑难问题进行了总结,最后对行人跟踪问题的研究进行了简单的展望。 相似文献
2.
3.
4.
计算机视觉中的设备标定和三维图形重构综述 总被引:15,自引:0,他引:15
这篇文章回顾了计算机视觉中的设备标定方法和三维重构的多种方法,介绍了各种方法的基本思想和特点,并对它们进行了相应的分析和比较。提出了现有的理论和方法在工程应用中存在的问题以及该学科研究和发展的动态。 相似文献
5.
为了综述目前基于序列图像的人体跟踪算法的研究现状,将人体跟踪问题分为人体运动目标检测与跟踪两部分分别加以讨论,系统地总结和介绍了目前人体检测与跟踪算法的研究技术和最新进展,比较了各种跟踪方法的优劣并总结了跟踪方法常用的搜索策略.针时人体跟踪算法中的难点问题进行了专门讨论,通过总结近几年相关文献对人体跟踪算法研究方向进行了展望. 相似文献
6.
视觉跟踪是计算机视觉的重要研究领域之一。传统的视觉跟踪算法难以很好地解决复杂背景中的跟踪问题,如光线变化、目标发生较大的尺寸和姿态变化或目标被遮挡等。而深度学习的引入为视觉跟踪研究开辟了新的途径。但目前国内外基于深度学习的视觉跟踪研究文献相对较少,为 吸引更多视觉跟踪领域研究者对深度学习进行探索和讨论,并推动视觉跟踪算法的研究,简要介绍了视觉跟踪和深度学习的研究现状,重点分析了基于深度学习的视觉跟踪算法的相关文献,讨论了各算法的优缺点,最后提出了进一步研究的方向以及对基于深度学习的视觉跟踪算法的展望。 相似文献
7.
8.
RGBT视觉跟踪是指融合可见光和热红外多模态图像信息进行视觉跟踪的新兴热点研究课题,合理融合可见光和热红外图像的互补信息可以提高跟踪器的性能和鲁棒性;人工智能技术的发展推动了 RGBT多模态视觉跟踪的发展,深度学习技术逐渐代替传统目标跟踪方法,在精确度与速度方面更具有优势;对近年来RGBT多模态视觉跟踪进行了全面综述,整理了 RGBT多模态视觉跟踪的发展历程,归纳和讨论了相关算法,具体包括基于相关滤波的方法和基于深度学习的方法;回顾了 RGBT多模态视觉跟踪数据集的发展历史,介绍了算法性能评估指标,分析了不同方法在评估数据集上的性能,展望了 RGBT多模态视觉跟踪的未来研究趋势;旨在为相关研究者提供全面的概览和参考,以促进RGBT多模态视觉跟踪领域的研究和发展. 相似文献
9.
10.
基于视觉的目标检测与跟踪是图像处理、计算机视觉、模式识别等众多学科的交叉研究课题,在视频监控、虚拟现实、人机交互、自主导航等领域,具有重要的理论研究意义和实际应用价值.本文对目标检测与跟踪的发展历史、研究现状以及典型方法给出了较为全面的梳理和总结.首先,根据所处理的数据对象的不同,将目标检测分为基于背景建模和基于前景建模的方法,并分别对背景建模与特征表达方法进行了归纳总结.其次,根据跟踪过程有无目标检测的参与,将跟踪方法分为生成式与判别式,对基于统计的表观建模方法进行了归纳总结.然后,对典型算法的优缺点进行了梳理与分析,并给出了其在标准数据集上的性能对比.最后,总结了该领域待解决的难点问题,对其未来的发展趋势进行了展望. 相似文献
11.
12.
MPEG-4视频编解码器设计实现与性能优化 总被引:1,自引:0,他引:1
在解读MPEG-4标准文档的基础上,首先分析了MPEG-4的DPCM/DCT视频编解码器混合模型及其设计与实现,具体的对编解码算法中运算大的部分运动估计、变换和编码进行了深入研究,并探讨了编解码器中的每一个功能模块的设计可能对整体的计算复杂度和压缩性能造成极大的影响并给出了折衷方案. 相似文献
13.
随着计算机和通信技术的发展,多媒体编码进入了一个新的时代,即将公布的MPEG-4国际标准表明基于对象的编码、基于模型的编码等第二代编码技术趋于成熟.文中首先从MPEG-4所支持的各种视频对象及其特点、场景的描述和不同应用的框架/级别等3个方面讨论了新的编码标准的主要内容和现状.新的标准用于实际应用还需要提供大量的标准之外的配套工具和研究.在随后的内容中,文中讨论了图像和视频的分割、全景图像的生成、人脸的检测与跟踪、2D网格模型的建立与跟踪以及3D人脸的分析和合成等相关领域的研究和进展情况. 相似文献
14.
一种面向运动的视频对象分割算法 总被引:9,自引:0,他引:9
在MPEG-4编码系统框架中,为支持基于内容的编码性能。视频自动、半自动分割成为关键技术之一。文中提出了一种利用以一组帧为参考帧将视频序列自动分割成静止背景和运动对象的算法。这种方法考虑了全局的运动,并且提出一种新的运动区域检测算法。算法主要思想是先对帧进行运动区域的简化,通过简化后的帧与原帧的帧差获取运动区域。将以一组帧为参考所检测出的运动区域合成一个二进制掩模,对这一掩模进行运动分析和形态滤波,从而获得最终的运动对象,实验结果表明,利用本文所提出的方法能够较精确地分割出运动的视频对象。 相似文献
15.
将视频系列分割成语义上有意义的对象即视频对象(VOP:Video Object Plane),是实现基于内容压缩编码标准MPEG-4的关键.本文分析T.Meier分割方法的不足:当镜头突变时,形态学波滤和变化检测掩码方法不能检测到独立运动部件;当视频对象消失时,Hausdorff距离匹配实效.本文通过检测镜头突变和判断视频对象的消失,克服了T.Meier种分割方法的不足.检测镜头突变方法简单、计算量不大且有较好的鲁棒性;通过慢变部分是否存在判断视频对象是否消失. 相似文献
16.
文章根据MPEG-4视频流语法定义,针对视频流当中不同的信息内容采用不同强度的FEC进行抗误码保护,同时利用MPEG-4视频流定义中的用户数据域(user_data)标识编码器所采用的FEC,并利用user_data反馈解码错误信息,使编码端可以动态调整FEC,达到能够自适应调整纠错能力和防止误码扩散的目的。实验结果表明,在高误码率环境下使用该文提出的抗误码方法可以大大提高视频恢复的质量,并且该方法与MPEG-4标准语法兼容,在没有增加过多信道负载和运算复杂度的前提下,具有一定的实用价值。 相似文献
17.
视频文件数据量大、网络带宽有限,针对这一特点,提出了一种将视频文件进行转换为低码率的MPEG-4格式的文件后分帧传输的方案。在实际工程中表明基于该方案设计的采用视频转码技术的网络多媒体传输系统可以使传输效率提高5~10。文中重点对方案中涉及的压缩转码过程进行了讨论分析,根据分析给出了在压缩编码过程中涉及到的一些参数,并进一步指出了视频转换编码模块的灵活性。 相似文献
18.
准确地估算信道失真是视频通信系统中联合功率率失真(P-R-D)优化的重要基础,提出了一种基于MPEG-4视频编码流的信道失真模型,采用帧间递归,根据信道平均误比特率和视频编码信息在编码器端实时估算视频序列的信道失真,仿真结果表明,对于不同的视频编码序列,在不同信道误比特率和信源编码率下,模型估算的平均相对偏差和绝对偏差较小,准确度高,为基于P-R-D优化的失真估算提供一个有力的工具。 相似文献
19.
基于MPEG-4的人脸表情图像变形研究 总被引:1,自引:0,他引:1
为了实时地生成自然真实的人脸表情,提出了一种基于MPEG-4人脸动画框架的人脸表情图像变形方法。该方法首先采用face alignment工具提取人脸照片中的88个特征点;接着在此基础上,对标准人脸网格进行校准变形,以进一步生成特定人脸的三角网格;然后根据人脸动画参数(FAP)移动相应的面部关键特征点及其附近的关联特征点,并在移动过程中保证在多个FAP的作用下的人脸三角网格拓扑结构不变;最后对发生形变的所有三角网格区域通过仿射变换进行面部纹理填充,生成了由FAP所定义的人脸表情图像。该方法的输入是一张中性人脸照片和一组人脸动画参数,输出是对应的人脸表情图像。为了实现细微表情动作和虚拟说话人的合成,还设计了一种眼神表情动作和口内细节纹理的生成算法。基于5分制(MOS)的主观评测实验表明,利用该人脸图像变形方法生成的表情脸像自然度得分为3.67。虚拟说话人合成的实验表明,该方法具有很好的实时性,在普通PC机上的平均处理速度为66.67 fps,适用于实时的视频处理和人脸动画的生成。 相似文献
20.