首页 | 本学科首页   官方微博 | 高级检索  
     

基于视频、音频和文本的视频分段
引用本文:朱映映,周洞汝.基于视频、音频和文本的视频分段[J].计算机工程与应用,2001,37(3):85-87.
作者姓名:朱映映  周洞汝
作者单位:武汉水利电力大学计算机科学与技术系
摘    要:在分析应用视频数据的过程中,视频分段是分析,组织,应用视频数据的基础。由于视频数据的多样性,传统的分段方法不能给出令人满意的结果,一般需要通过人机交互来进行。文中将较为成熟的文本分析、语音处理、图像处理三种技术进行综合,互为补充,对视频流进行分割。文本分析的对象是语音转换成的文本、标题、注释等。语音处理包括语音识别和语音信号分析。语音识别将视频中的自然语言转换为文字。语音信号分析对视频材料中的语音成分进行基础分析。图像处理主要用来处理视频中的图像部分。文章阐述了视频流的分段层次,文本分析,语音处理算法以及镜头突变,镜头渐变识别算法的思想。

关 键 词:视频分段  镜头  文本分析  语音识别  图像处理
修稿时间:2000年6月1日

Vision,Speech and Text for Video Segmentation
Zhu Yingying,Zhou Dongru.Vision,Speech and Text for Video Segmentation[J].Computer Engineering and Applications,2001,37(3):85-87.
Authors:Zhu Yingying  Zhou Dongru
Abstract:In the process of analyzing,applying the video data,video segmentation is the foundation of analyzing,organizing,applying the video data. Because of the variety of video data,the traditional segmentation cannot be gratifying and has to recourse to man-machine interaction. In this paper,we integrate text analysis,speech processing,image processing which are mature relatively to segment the video flow. The objects of text analysis are the words that were spoken,annotations and close-caption available. Speech processing includes speech recognition and speech signal analysis. Speech recognition converts the natural language into words. Speech signal analysis provides the basis for analyzing the audio component of the material. image processing looks at the images in the video-only portion. Basic ideas and algorithm modules are given in detail.
Keywords:video segmentation  shot  text analysis  speech recognition  image processing  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号