首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
随着多媒体技术和国际标准MPEG-4,MPEG-7的推出发展,基于内容的视频分析已经成为研究的热点。对基于内容视频分析中的视频分割、视频描述和视频检索三个主要问题进行了深入的探讨研究。对各个领域的最新研究算法进行了比较和评述,详细论述了这些方面已取得的成果、面临的困难和未来发展方向,最后对基于内容视频分析的发展进行了总结和展望。  相似文献   

2.
随着多媒体技术和国际标准MPEG-4 、MPEG-7 的推出发展, 基于内容的视频分析已经成为研究的热点。对基于内容视频分析中的视频分割、视频描述和视频检索三个主要问题进行了深入的探讨研究。对各个领域的最新研究算法进行了比较和评述, 详细论述了这些方面已取得的成果、面临的困难和未来发展方向, 最后对基于内容视频分析的发展进行了总结和展望。  相似文献   

3.
视频分割技术的发展   总被引:28,自引:1,他引:27  
随着MPEG-4和MPEG-7的研究发展以及最近几年数字视频图书馆技术的崛起,基于内容编码和面向对象的存取和操纵技术日益受到人们的重视,视频分割技术迅速成为当前视频研究领域的热点。视频分割是新一代视频编码、视频检索、互联网多媒体交互等新兴领域的关键技术。介绍了视频分割的主要技术,对其算法和性能进行了比较和评述,并分析了当前视频分割技术的研究现状、尚存在的问题和研究前景。  相似文献   

4.
基于内容检索中的视频处理技术研究   总被引:17,自引:2,他引:17  
基于内容的检索能使用户根据媒体特征对媒体内容进行检索和查询。由于多媒体数据中含有丰富的视频数据,并且是随时间动态变化的,其特征很难用一般的静态特征来描述。这给基于内容的检索带来很大困难。为了取得视频数据的特征,对视频数据的处理非常重要。本文介绍了基于内容的视频检索中视频的处理技术和方法,提出了一种渐变镜头的检测方法。讨论了基于内容的视频检索研究中值得探索的几个主要问题。  相似文献   

5.
随着网络和多媒体技术的不断发展,基于内容的多媒体信息检索技术变得越来越重要.同成熟的文本检索技术相比,视频检索还处在研究和探索阶段.视频检索的一个有效方法是将无结构的视频节目进行镜头分割,根据每个镜头的关键帧对视频建立索引.因此,镜头分割是基于内容的视频检索的基本步骤,在各种类型的镜头检测算法中,叠化镜头是很难检测的.根据叠化(dissolve)镜头内部预测帧预测误差能量和运动矢量分布特点,提出一种在压缩域中分割叠化镜头的新算法.与公开发表的同类算法相比,它具有以下优点:工作在压缩域上、速度快、鲁棒性好、精度更高.  相似文献   

6.
基于内容的检索是一种新型的多媒体视频检索技术。本文分析了它与传统检索技术的不同以及它们的技术特点,并指出了基于内容的视频节目检索的关键技术。  相似文献   

7.
视频序列图像中运动对象分割综述*   总被引:11,自引:1,他引:10  
视频分割技术作为多媒体技术应用的一个主要方面, 在视频编码、检索、多媒体交互中存在着广阔的前景, 而且在计算机视觉中也有着极为重要的应用; 但是由于视频图像内容复杂, 还没有一个通用的分割方法, 视频分割算法还面临着挑战。主要介绍视频分割中采用的一些算法, 并对各种算法和性能进行了比较和讨论。  相似文献   

8.
基于内容的视频检索是目前多媒体检索领域中的一个重要课题,由于视频体现了图像中对象的动态特征,因此如何提取视频对象的运动特征并且用于检索成为基于内容视频检索研究的热点.利用改进的8方向链码编码对视频对象运动轨迹进行编码,重点突出了对象运动的变化特征,同时采用归一化编码技术,增强了改进编码方法对尺度和旋转变换的鲁棒性.最后采用编辑距离来度量运动轨迹的相似性测度,实验结果表明,该算法能够有效地检索出运动轨迹相似的视频片断.  相似文献   

9.
CBIR系统中的图象语义分割技术   总被引:3,自引:0,他引:3  
随着数字图象技术、宽带网络技术和数字存储设备技术的发展,在网络上存储、传输大规模分布式数字图象库成为可能,因此研究基于内容的图象检索技术成为近几年的热点。实现基于内容的图象检索系统的关键问题是实现图象的语义分割。该文分六类对现有的图象语义分割技术进行了全面的总结,为进一步研究基于内容的图象检索技术奠定了基础。  相似文献   

10.
一种从MPEG压缩视频流中提取关键帧的方法   总被引:15,自引:0,他引:15       下载免费PDF全文
在基于视频内容检索的多媒体系统中,由于需要进行镜头分割和提取关键帧,还需要用静态图象来表示视频内容以及该图象的特性进行分析,因此根据视频序列中相邻画面一般具有相似性和连续性这一镜头分割和关键帧提取的共同理论依据,构造了关键帧提取系统,它能直接提取关键帧,而不用先进行镜头分割,且只需要Ⅰ帧信息及其频域直流分量的信息,即能达到最小程度的解码,在关键帧的判定方面,通过分析当前镜头分割技术的特点及其发展方向,提出了质点等价法和基于宏块互异的方法。  相似文献   

11.
这篇文章,主要是从宏观上总结了一下现阶段图像视频底层技术的发展及应用点,从一个图像视频算法研究人员的角度谈一谈对这个领域的认识。图像视频领域的商业应用,集中在多媒体娱乐、互联网、智能监控、工业机器视觉、OCR、生物特征识别、医学图像处理以及军事国防几个领域,多媒体领域是其中的一个重要分支,很多图像视频领域的新算法和新理论往往在多媒体领域得到最先的应用。  相似文献   

12.
随着Internet和多媒体应用的迅速发展,基于小波的图像和视频编码方法的研究已经成为多媒体信息处理的重要研究领域之一。该文对基于小波的图像和视频的编码情况进行了综述,首先介绍了可用于图像和视频编码的小波变换特性,然后对目前基于小波的图像和视频编码的主要方法和研究情况进行了讨论,同时对JPEG-2000和MPEG-4VTC中小波的应用情况进行了介绍,最后对基于小波的图像和视频编码未来的发展情况进行了展望。  相似文献   

13.
视频的渐进传输、视频数据库浏览等多分辨率环境下的多媒体应用产生了视频可分级编码.本文首先对视频可分级编码的含义和种类进行了说明,然后对重要的视频压缩国际标准进行了概述,在此基础上,对视频压缩国际标准中各类视频可分级编码的编码思想和研究进展进行了分析和讨论,最后对视频可分级编码技术的发展进行了展望.  相似文献   

14.
当今,多媒体的应用正在飞速发展.视频通信的保密性是商业实践上的主要考虑,例如收费性视频或者多方视频会议.特定的加密算法在实时多媒体通信中被用来满足严格的时效要求.引入了一个创新的视频加密,名为Puzzle,来为软件中的视频数据加密.它具有实时所要求的速度并提供了足够的安全保护.该算法能够随时嵌入至已存在的多媒体系统中.  相似文献   

15.
两种基于部分加密的图像和视频加密方案   总被引:3,自引:0,他引:3  
某些多媒体加密并不要求加密后的信息完全不可理解,例如,在图像传输中可能只要求对其中某个人、物或区域部分加密;在视频点播中可能只要求将原始画面变得模糊,而其中的轮廓可见。正是基于以上两点,文章提出两种部分加密方案:基于分层编码的部分加密方案和基于目标的部分加密方案。并分别以小波变换的分层编码方法SPIHT和DCT变换的分块编码方法JPEG为例,分析了以上两种加密方案的效果和可能的应用前景。  相似文献   

16.
As more information sources become available in multimedia systems, the development of abstract semantic models for video, audio, text, and image data is becoming very important. An abstract semantic model has two requirements: it should be rich enough to provide a friendly interface of multimedia presentation synchronization schedules to the users and it should be a good programming data structure for implementation in order to control multimedia playback. An abstract semantic model based on an augmented transition network (ATN) is presented. The inputs for ATNs are modeled by multimedia input strings. Multimedia input strings provide an efficient means for iconic indexing of the temporal/spatial relations of media streams and semantic objects. An ATN and its subnetworks are used to represent the appearing sequence of media streams and semantic objects. The arc label is a substring of a multimedia input string. In this design, a presentation is driven by a multimedia input string. Each subnetwork has its own multimedia input string. Database queries relative to text, image, and video can be answered via substring matching at subnetworks. Multimedia browsing allows users the flexibility to select any part of the presentation they prefer to see. This means that the ATN and its subnetworks can be included in multimedia database systems which are controlled by a database management system (DBMS). User interactions and loops are also provided in an ATN. Therefore, ATNs provide three major capabilities: multimedia presentations, temporal/spatial multimedia database searching, and multimedia browsing  相似文献   

17.
从多媒体数据的特征研究出发,分别介绍了面向对象的数据模型、NF2数据模型、超媒体数据模型、信息元等多媒体数据模型,研究基于内容的图像、视频等多媒体媒体的的检索方法,对建立多媒体数据库系统具有普遍的指导意义和实用价值。  相似文献   

18.
The need for content-based access to image and video information from media archives has captured the attention of researchers in recent years. Research efforts have led to the development of methods that provide access to image and video data. These methods have their roots in pattern recognition. The methods are used to determine the similarity in the visual information content extracted from low level features. These features are then clustered for generation of database indices. This paper presents a comprehensive survey on the use of these pattern recognition methods which enable image and video retrieval by content.  相似文献   

19.
多媒体数据挖掘的体系结构和方法   总被引:6,自引:1,他引:6  
提出了一个多媒体数据挖掘系统的一般结构(M3),包括多媒体数据库(MD)、多媒体挖掘引擎(MME)和多媒体挖掘界面(MMI),重点分析了几种挖掘方法(分类、关联和聚类)在多媒体挖掘中的应用。针对不同的媒体,如图像、音频、视频,讨论了各自的挖掘特点和主要挖掘内容。  相似文献   

20.
Easy-to-use audio/video authoring tools play a crucial role in moving multimedia software from research curiosity to mainstream applications. However, research in multimedia authoring systems has rarely been documented in the literature. This paper describes the design and implementation of an interactive video authoring system called Zodiac, which employs an innovative edit history abstraction to support several unique editing features not found in existing commercial and research video editing systems. Zodiac provides users a conceptually clean and semantically powerful branching history model of edit operations to organize the authoring process, and to navigate among versions of authored documents. In addition, by analyzing the edit history, Zodiac is able to reliably detect a composed video stream's shot and scene boundaries, which facilitates interactive video browsing. Zodiac also features a video object annotation capability that allows users to associate annotations to moving objects in a video sequence. The annotations themselves could be text, image, audio, or video. Zodiac is built on top of MMFS, a file system specifically designed for interactive multimedia development environments, and implements an internal buffer manager that supports transparent lossless compression/decompression. Shot/scene detection, video object annotation, and buffer management all exploit the edit history information for performance optimization.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号