首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 69 毫秒
1.
视频摘要技术综述   总被引:7,自引:0,他引:7  
基于内容的视频分析,检索与索引技术是当前多媒体领域研究的热点之一,视频要主要分为两类,静态视频要模式(视频略览),包括基于MPEG-1/2的关键帧表示和MPEG-4的关键对象表示;动态视频要模式(视频梗概),包括视频概述和精彩片段,该介绍了视频要的新方向——基于情感,心理学等视频要模型。  相似文献   

2.
多视频摘要技术近年来受到了国内外学者的广泛关注,它是指通过对视频结构和内容的分析,从多个相关视频文件中提取出有意义的部分,将它们以一定方式进行组合,形成简洁的、能够充分表现语义内容的概要,目的是提供快捷的浏览和查询服务。目前该技术还处于起步阶段,实际的应用系统很少,有关体系结构、技术方法仍需要深入研究,更多的应用方向还有待开拓。在介绍研究意义的基础上,对多视频摘要的研究现状和主要方法进行了归纳、评述,探讨了一些应用方向,指出了目前研究面临的重点问题以及发展趋势。  相似文献   

3.
视频摘要技术研究   总被引:2,自引:0,他引:2  
对视频摘要技术进行了研究,将视频摘要按其表现形式分为以标题、关键帧和故事板为代表的静态视频摘要以及以缩略视频为代表的动态视频摘要,并对其中涉及的关键技术进行了探讨,最后对视频摘要技术未来的发展方向进行了总结与展望。  相似文献   

4.
视频摘要技术是当前多媒体领域研究的热点之一。视频摘要生成方法归结为两类:基于关键帧的视频摘要和基于对象的视频摘要;对基于关键帧的视频摘要方法做了简要的介绍,并重点总结了历年来出现的基于对象的视频摘要的生成方法。最后对视频摘要技术的发展做出了总结和展望。  相似文献   

5.
压缩域视频内容分析与摘要提取技术   总被引:5,自引:0,他引:5  
给出了压缩域视频摘要系统的结构框架,并对其中的压缩域视频镜头变换检测、关键帧提取和压缩域人脸检测等主要算法进行了讨论.  相似文献   

6.
介绍了视频摘要的相关概念、作用以及视频摘要所涉及到的一些关键技术,探讨了视频结构化的主要步骤,在分析监视视频特征的基础上,给出了一个基于内容的监视视频摘要系统模型。  相似文献   

7.
介绍了视频摘要的相关概念、作用以及视频摘要所涉及到的一些关键技术,探讨了视频结构化的主要步骤,在分析监视视频特征的基础上,给出了一个基于内容的监视视频摘要系统模型。  相似文献   

8.
新闻视频挖掘技术研究   总被引:4,自引:0,他引:4  
新闻视频挖掘是一个新兴的研究领域,也是多媒体数据挖掘的典型代表。本文对新闻视频挖掘技术进行了全面深入的讨论,首先从概念上对新闻视频挖掘进行了界定,提出了新闻视频挖掘的层次框架和技术框架,指出新闻视频挖掘包括低层视频挖掘和高层视频挖掘两个层次。其中,低层视频挖掘是利用数据挖掘的方法对视频内容进行分析的过程,而高层数据挖掘则是在低层挖掘的基础上进一步发现视频中的知识的过程。新闻视频挖掘的技术框架则对挖掘所涉及到的具体技术进行了分析。最后,对新闻视频挖掘中的结构挖掘、语义内容挖掘、视频摘要、趋势挖掘、关联挖掘等任务进行了详细的阐述,并对各种任务举出了具体的示例加以说明。  相似文献   

9.
自动视频内容分析综述   总被引:1,自引:0,他引:1  
1.概述多媒体技术和网络技术的向前发展导致了大量视频信息的出现,如何对这些视频信息进行有效的组织、管理和检索便成了一个重要的研究课题。视频媒体是一类二进制巨型对象(BLOB对象),它拥有巨大的数据量,但内容却有很大的冗余。数字视频通常被当作一种不透明的线性比特流进行处理。例如,为了查找一场足球比赛中的所有射门镜头,就需要对视频内容进行从头到尾的浏览。这种方式效率非常低下。如果能将这样一个非结构化的流数据变成结构化的数据,则查找的效率将大大提高。尽管视频数据在形式上无结构性可言,但在内容上却具有很强的逻辑性。为此,人们为视频数据建立了合  相似文献   

10.
一种MPEG-7视频语义摘要系统   总被引:1,自引:0,他引:1  
谢波  申瑞民  江济 《计算机仿真》2004,21(2):132-135
该文设计并且实现了一个应用于E-Learning领域的视频语义摘要系统,它包括一个兼容MPEG-7标准的标注子系统、搜索引擎子系统和一个内容整合子系统;它专注于E-Learning领域,不但可以在多媒体的后期处理中添加描述,而且能实时录制/自动实时描述和辅助以语音参考描述。  相似文献   

11.
Automatic personalized video abstraction for sports videos using metadata   总被引:1,自引:1,他引:0  
Video abstraction is defined as creating a video abstract which includes only important information in the original video streams. There are two general types of video abstracts, namely the dynamic and static ones. The dynamic video abstract is a 3-dimensional representation created by temporally arranging important scenes while the static video abstract is a 2-dimensional representation created by spatially arranging only keyframes of important scenes. In this paper, we propose a unified method of automatically creating these two types of video abstracts considering the semantic content targeting especially on broadcasted sports videos. For both types of video abstracts, the proposed method firstly determines the significance of scenes. A play scene, which corresponds to a play, is considered as a scene unit of sports videos, and the significance of every play scene is determined based on the play ranks, the time the play occurred, and the number of replays. This information is extracted from the metadata, which describes the semantic content of videos and enables us to consider not only the types of plays but also their influence on the game. In addition, user’s preferences are considered to personalize the video abstracts. For dynamic video abstracts, we propose three approaches for selecting the play scenes of the highest significance: the basic criterion, the greedy criterion, and the play-cut criterion. For static video abstracts, we also propose an effective display style where a user can easily access target scenes from a list of keyframes by tracing the tree structures of sports games. We experimentally verified the effectiveness of our method by comparing our results with man-made video abstracts as well as by conducting questionnaires.
Noboru BabaguchiEmail:
  相似文献   

12.
针对现有煤矿井下视频传输系统存在视频清晰度低、传输速率不稳定、兼容性差等问题,设计了一种矿用实时视频传输系统。该系统采用960 nm红外激光作为辅助光源,利用MCCD图像传感器采集视频信号,提高了低光照强度或黑暗环境下视频清晰度;通过视频解码模块TVP5150将采集的PAL制式模拟视频信号转换为YUV数字信号,数字信号经多格式编码器进行H.264压缩编码,并在此基础上添加UDP报文头进行RTP封装,提高了视频数据传输的时效性;通过Live555流媒体服务器进行数据流化,使用ONVIF标准封装RTSP视频流,通过Socket网络编程实现实时视频流数据网络传输,提高了系统兼容性和传输速率稳定性。测试结果表明,该系统视频传输速率为2.190 Mbit/s,丢包率约为1.256%,达到实时视频传输要求。  相似文献   

13.
视频摘要的现状和研究进展   总被引:1,自引:0,他引:1  
首先概述了视频摘要的概念和分类、视频摘要生成方法及视频摘要模型的建立,综述了国内外视频摘要系统。最后探讨了视频摘要的性能评估、存在问题和发展方向。  相似文献   

14.
提出了一种基于K-L变换和聚类的视频摘要方法。首先通过对视频帧原始RGB空间进行K-L变换,得到由主轴构成的参数模型;其次运用滑动窗口法进行镜头检测;再次,根据最邻近规则对每个镜头的视频帧进行聚类;最后通过后处理优化聚类结果,提取最靠近聚类中心的帧作为关键帧,组成视频摘要。以新闻视频为例,实验结果证明了算法的有效性。  相似文献   

15.
A framework for knowledge-based temporal abstraction   总被引:1,自引:0,他引:1  
《Artificial Intelligence》1997,90(1-2):79-133
A new domain-independent knowledge-based inference structure is presented, specific to the task of abstracting higher-level concepts from time-stamped data. The framework includes a model of time, parameters, events and contexts. A formal specification of a domain's temporal abstraction knowledge supports acquisition, maintenance, reuse and sharing of that knowledge.

The knowledge-based temporal abstraction method decomposes the temporal abstraction task into five subtasks. These subtasks are solved by five domain-independent temporal abstraction mechanisms. The temporal abstraction mechanisms depend on four domain-specific knowledge types: structural, classification (functional), temporal semantic (logical) and temporal dynamic (probabilistic) knowledge. Domain values for all knowledge types are specified when a temporal abstraction system is developed.

The knowledge-based temporal abstraction method has been implemented in the RÉSUMÉ system and has been evaluated in several clinical domains (protocol-based care, monitoring of children's growth and therapy of diabetes) and in an engineering domain (monitoring of traffic control), with encouraging results.  相似文献   


16.
随着信息技术的快速发展,以视频为主的新媒体极大改变了信息传播方式。但是视频中不安全内容的传播容易带来潜在风险,可能产生不良社会影响,并造成一定损失。因此,视频内容的安全性研究具有重要的理论价值和重大应用需求,受到了研究人员的广泛关注。视频内容安全评价是描述视频内容安全性的重要方法,能够有效管理视频中不良信息的传播风险,降低影响和损失。本文从建立技术理论体系角度,围绕4个方面的内容监管,梳理了视频内容安全评价体系。围绕5个评价原则,总结了视频内容安全评价方法,阐述了基于PDCA (plan-do-check-act)原理的视频内容安全评价流程;综合考虑不良内容的特点,从5个方面提炼形成了视频内容安全评价指标,包括内容干扰度、内容恶意度、内容敏感度、内容暴露度和内容倾向度。给出视频内容安全风险计算的过程,阐述了基于层次分析的量化方法,从而得到视频内容风险程度,即视频内容安全风险值,结果考虑了决策的主客观特征;从高、中、低3个等级评价视频内容风险严重性的总体水平,更便于优化视频内容风险处理顺序。等级排序不仅提高了检测发现安全风险的效率,也为视频内容分级提供数据支撑。最后分析了视频内容评价面临的挑战机遇,详尽总结了十大待解决问题,展望了未来研究方向与发展趋势。  相似文献   

17.
为提高视频语义信息提取准确率,提出了一种基于多模态特征的新闻视频语义提取框架。在视频中提取主题字幕信息,对音频进行分类和语音识别,根据主题字幕信息借助搜索引擎得到与新闻视频相关的网页;最后利用网页文本对语音识别的结果进行纠错,从而通过视频字幕信息和语音脚本的跨模态融合提高视频语义提取的准确率。在中等规模的新闻视频(含新闻网页)库测试表明了该方法的有效性,经纠错后的语音识别准确率达到了65%左右。  相似文献   

18.
介绍了多视点视频点播系统的框架结构,提出了多视点视频系统的关键技术、网络传输控制以及具体实现方法。  相似文献   

19.
实时音视频数据采集和传输系统设计方法的比较研究   总被引:1,自引:1,他引:0  
在Windows环境下设计实时音视频数据采集和传输系统常用的3种方法是VFW、DireetShow或Wmdows Media.这3种方法代表了Windows在实时音视频数据采集和传输技术上的主要内容,每种方法各有自己的适用场合和优缺点.在系统仿真、电子游戏、音视频数据非线性编辑等应用中,最好选用DirectShow.在需要将采集到的数据进行实时网络传输的场合,使用Windows Media会收到事半功倍的效果.而VFW在数据采集方面用的已经不多,但在AVI-2文件的非线性编辑处理和图像显示方面仍然具有广泛的应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号