首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
王妍  詹雨薇  罗昕  刘萌  许信顺 《软件学报》2023,34(2):985-1006
视频片段检索旨在利用用户给出的自然语言查询语句,在一个长视频中找到最符合语句描述的目标视频片段.视频中包含丰富的视觉、文本、语音信息,如何理解视频中提供的信息,以及查询语句提供的文本信息,并进行跨模态信息的对齐与交互,是视频片段检索任务的核心问题.系统梳理了当前视频片段检索领域中的相关工作,将它们分为两大类:基于排序的方法和基于定位的方法.其中,基于排序的方法又可细分为预设候选片段的方法和有指导地生成候选片段的方法,而基于定位的方法则可分为一次定位的方法和迭代定位的方法.同时对该领域的数据集和评价指标进行了介绍,并对一些模型在多个常用数据集上的性能进行了总结与整理.此外,介绍了该任务的延伸工作,如大规模视频片段检索工作等.最后,对视频片段检索未来的发展方向进行了展望.  相似文献   

2.
李向伟  康毓秀 《软件》2014,(8):26-31
视频检索与挖掘是当前计算机视觉、视频分析及知识挖掘等领域的研究热点之一,在现实生活中有广泛的应用前景。基于内容的视频检索与挖掘是一种自动、智能的多媒体信息检索技术,借助于最新数学分析理论与工具,对视频数据进行建模,在此基础上进行智能分析处理的一项技术。本文从分析基于内容的视频检索与挖掘系统的结构和原理出发,详细的讨论了视频检索与挖掘的关键技术:镜头检测与关键帧提取,并对新的国际标准MPEG及其框架下的视频检索与挖掘技术作了介绍,最后对视频检索与挖掘的前景与发展方向作了展望。  相似文献   

3.
基于内容检索的视频处理技术   总被引:32,自引:1,他引:31       下载免费PDF全文
从分析视频数据的结构和特点出发,总结了基于内容检索的视频处理方法的一般步骤,即视频分割、关键帧选取、静态和动态特征提取以及视频聚类等,然后深入介绍了各个处理过程中的一些最新方法,并分析了各种方法和技术的优缺点;最后,对基于内容的视频检索提出一些值得进一步研究的问题。  相似文献   

4.
基于内容的视频检索系统是将视频结构化并依赖视频数据中的视觉特征以及时空特征进行相似度衡量的系统.讨论目前国内外基于内容视频检索领域的研究现状和发展趋势,并研究对基于内容的视频检索的关键技术和方法.  相似文献   

5.
近年来,随着视频监控系统在自然保护区的大量部署,如何有效利用日益增加的海量视频监控数据成为亟待解决的难题.通过基于图像相似度的关键帧提取算法对海量视频数据进行清洗和压缩,同时利用基于深度学习的目标检测算法提取关键帧中的有效视频信息,并提供多种基于内容的视频检索方式,自动对用户提交的检索内容进行分析与处理,从而快速检索出感兴趣的视频.通过对青海湖野生动物视频监控数据进行分析与检索,验证了该系统的有效性.  相似文献   

6.
本文建立一个能与各种网络视频监控设备互联互通、基于SIP数据传输协议(同时兼容H.323)互联互通的基础中间件;进而深入应用软件的资源层、业务层和表现层建立应用中间件;最终面向具体应用领域建立领域应用框架(或平台),从而全方位支撑网络的视频监控系统的综合集成。该系统已经应用于国家高考网络视频监控系统,取得了良好的效果。  相似文献   

7.
深度学习由于其强大的特征表示能力在图像处理、语音识别、推荐系统能领域取得了重大进展.论文提出了一种基于深度学习的针对视频对特定人进行检索的方法,该方法综合使用了MTCNN的人脸检测与对齐以及FaceNet的人脸识别功能,同时论文针对视频连续性的特点,对检索结果进行了特殊处理,实验结果表明论文方法具有较高的准确率和较快的速度.  相似文献   

8.
新闻视频作为视频数据中有代表性的一种媒体,受到人们的广泛关注,对新闻视频的检索要求也越来越高.传统的新闻视频检索大多是非语义层面的,采用的是基于关键词的检索方法,难于获得令人满意的查准率和查全率.本文提出一种基于领域本体的新闻视频检索框架,定义了新闻视频检索中的新闻视频对象,使用语义表达能力强的领域本体来指导视频语义对象的标注,并针对“一词多义”问题提出了“概念域-概念”两阶段概念消歧算法;针对自然语言检索问题,使用领域本体进行查询优化和查询扩展,并提出了查询语句自动生成方法.实验表明,基于领域本体的新闻视频检索方法可以有效的提高检索性能.  相似文献   

9.
图象和视频的检索技术   总被引:10,自引:0,他引:10  
随着网络技术的发展,多媒体数据将成为网络服务的主要内容,因此对多媒体数据管理问题的研究成为近几年的热点。由于媒体信息表现性质的不同,传统关系数据库的检索方式不再适用于图象和视频,因此,必须采用基于自身内容的检索方式。文章对基于内容的图象和视频检索技术分不同层次进行了全面的总结,内容包括依据基本特征,色彩、纹理、形状、和位置关系的技术,视频的场景分割、关键帧提取技术以及基于声音、文字的检索技术等,并阐述了各种方法的优缺点,现状及发展方向。  相似文献   

10.
视频摘要技术综述   总被引:2,自引:0,他引:2       下载免费PDF全文
目的 类似于文本摘要,视频摘要是对视频内容的总结。为了合理地评估视频摘要领域的研究进展,正确导向视频摘要的继续研究,本文归纳总结视频摘要技术的主要研究方法和显著性成果,对视频摘要技术进行综述。方法 依据视频摘要的两个主要生成步骤:视频内容分析和摘要生成分别介绍视频摘要的主要研究方法。同时,分析了近5年视频摘要领域的研究状况,对视频摘要发展的新趋势:实时视频摘要和多视角视频摘要进行了阐述。最后,还对视频摘要的评价系统进行了分类总结。结果 对视频摘要进行综述,对摘要中的语义获取难题提出了2种指导性建议。并依据分析结果,展望了视频摘要技术未来的发展方向。结论 视频摘要技术作为视频内容理解的重要组成部分,有较大研究价值。而目前,视频摘要在视频语义表达和摘要评价系统方面并不精确完善,还需进一步的深入研究。  相似文献   

11.
Video in digital format is now commonplace and widespread in both professional use, and in domestic consumer products from camcorders to mobile phones. Video content is growing in volume and while we can capture, compress, store, transmit and display video with great facility, editing videos and manipulating them based on their content is still a non-trivial activity. In this paper, we give a brief review of the state of the art of video analysis, indexing and retrieval and we point to research directions which we think are promising and could make searching and browsing of video archives based on video content, as easy as searching and browsing (text) web pages. We conclude the paper with a list of grand challenges for researchers working in the area.  相似文献   

12.
本文提出了一种基于视频对象的视频内容分级描述模型.视频序列首先被分成一个个的镜头,在每个镜头内对视频对象进行分割和跟踪.按照镜头、视频对象、视频对象平面和视频对象区域四级框架提取特征,对视频内容进行分级描述.本文对视频内容信息的描述可以用于视频检索、视频注释等应用.  相似文献   

13.
计算机与通讯技术的发展与融合,为人们带来了一种全新的通讯方式-可视通讯。这种全新的通讯方式将会极大地改变人们未来的生活与工作方式。本文将结合作者研究H.324可视电话的实际工作,探讨其中的一些关键技术。并在文章的最后,从系统优化的角度,给出作者关于H.324视频会议系统在设计、实现与验证阶段对这些关键处理的一些看法与经验。  相似文献   

14.
文章通过对多媒体影视制作中所涉及到的技术的探讨,结合实际制作经验,简要阐述了在多媒体视频处理中,所涉及到的基础知识、硬件设备及各种连接方式,为视频的处理提供一个良好的操作平台,确保作品质量,再配备合适的软件加以处理将带给观赏者更完美、更赏心悦目的画面.  相似文献   

15.
视频结构挖掘的概念及应用*   总被引:3,自引:0,他引:3  
提出了一种视频结构挖掘的概念框架和视频结构挖掘系统框架,在概念框架中对视频结构挖掘相关概念给出了规范化的定义,视频结构挖掘框架包括的主要内容有视频基本结构挖掘、视频语法结构挖掘和视频语义结构挖掘。最后讨论了视频结构挖掘中发现的结构模式和知识的具体应用,包括指导视频的组织与管理、实现基于内容的个性视频推荐和改善视频摘要系统。  相似文献   

16.
Automatic parsing and indexing of news video   总被引:9,自引:0,他引:9  
Automatic construction of content-based indices for video source material requires general semantic interpretation of both images and their accompanying sounds; but such a broadly-based semantic analysis is beyond the capabilities of the current technologies of machine vision and audio signal analysis. However, if one can assume a limited and well-demarcated body of domain knowledge for describing the content of a body of video, then it becomes easier to interpret a video source in terms of that domain knowledge. This paper presents our work on using domain knowledge to parse news video programs and to index them on the basis of their visual content. Models based on both the spatial structure of image frames and the temporal structure of the entire program have been developed for news videos, along with algorithms that apply these models by locating and identifying instances of their elements. Experimental results are also discussed in detail to evaluate both the models and the algorithms that use them. Finally, proposals for future work are summarized.  相似文献   

17.
视频信号在处理之前为改善信号质量需要必要的预处理过程,主要包括视频嵌位、视频滤波、视频放大及驱动等.本文首先介绍视频预处理的原理及必要性;其次介绍一款专门为改善视频信号的质量设计的芯片MAX7450,该器件包括内建视频输入嵌位器、自动增益控制器、同步丢失检测器、带外噪声滤波器及可供用户选择增益的缓冲器等;最后介绍该芯片在视频预处理中的应用.  相似文献   

18.
This paper proposes a new play segmentation algorithm using a local adaptive model for each sports game, in which the play start shots (PSS) that represent the start of each play segment are detected by comparing all of keyframes with the PSS model. The PSS model is calculated on the fly using generic clustering algorithm and a repetitive characteristic of the PSS. The end of each play segment (the play end shot (PES)) is determined by detecting close up shots using the field color extracted from the play start shots since the camera will focus on the players or the audience with close up view. Experimental results with 28 baseball videos show that good performance can be obtained with the proposed algorithm compared to other algorithms.
Jinguk JeongEmail:
  相似文献   

19.
文章通过对多媒体影视制作中所涉及到的技术的探讨,结合实际制作经验,简要阐述了在多媒体视频处理中,所涉及到的基础知识、硬件设备及各种连接方式,为视频的处理提供一个良好的操作平台,确保作品质量,再配备合适的软件加以处理将带给观赏者更完美、更赏心悦目的画面。  相似文献   

20.
Full motion video traffic is envisaged to be a major source for Internet and broadband integrated services digital networks (B-ISDN). Accurate traffic models of full motion video are needed to design networks and improve video services. Auto-regressive process (AR) proves to be a viable modeling approach of full motion video. A considerable amount of effort on AR video modeling has been reported in the recent studies which need to be thoroughly investigated. The aim of this paper is: (1) to survey a number of AR models for full motion video; (2) to classify the models according to their properties and framework; (3) to compare and contrast the models based on their attributes: residual, coding scheme, capturing scene changes, number of parameters, level of modeling, and complexity; (4) to show the ability of these models to predict accurately different aspects of network performance; (5) to give recommendations that might be helpful in determining the appropriate model for full motion video based on the target application; (6) to give direction for future work on this important modeling scheme.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号