首页 | 本学科首页   官方微博 | 高级检索  
     

多模态体育视频语义分析
引用本文:刘宇驰,栾悉道,戴端辉,吴玲达. 多模态体育视频语义分析[J]. 计算机科学, 2007, 34(1): 109-111
作者姓名:刘宇驰  栾悉道  戴端辉  吴玲达
作者单位:国防科学技术大学信息系统与管理学院,长沙,410073;空军雷达学院一系,武汉,430019;国防科学技术大学信息系统与管理学院,长沙,410073;陆军航空兵学院模拟训练中心,北京,101114
摘    要:以足球运动为例提出了一种体育视频语义结构,并提出相应的语义分析框架。视频被分解为纯视频流和音频流两种模态,每种模态均可依次提取和综合出低层内容和中层内容。视频流可根据低层(物理)内容分割为物理镜头,然后根据特定的中间层内容可以确定为语法镜头。音频也可以在物理特征的基础上形成有意义的中间层内容,如解说员兴奋时的声音。最后,根据视频流和音频流的中间层内容,按照足球比赛转播的规律,分析出比赛中的精彩事件,并选取相关的镜头作为反映此事件的序列组合。

关 键 词:体育视频  多模态  语义分析  语法镜头

Multi-modal Analysis of Sports Video for Semantics
LIU Yu-Chi,LUAN Xi-Dao,DAI Duan-Hui,WU Ling-Da. Multi-modal Analysis of Sports Video for Semantics[J]. Computer Science, 2007, 34(1): 109-111
Authors:LIU Yu-Chi  LUAN Xi-Dao  DAI Duan-Hui  WU Ling-Da
Affiliation:1National University of Defense and Technology, Changsha 410073;2Air Force Radar Academy, Wuhan 430019;3Center of Simulation Training of Army Aviation Institute, Beijing 101114
Abstract:A semantic structure of sports video, exampled with soccer, and corresponding framework for semantics analysis are proposed. Video is parsed into pure video stream and audio stream. Video is segmented into shots according to low/physical features, and then into syntactic shots with the help of specific middle level contents. Audio can be extracted meaningful middle contents, e.g. excited speech of commenter. According to rules of soccer broadcasting, semantics of highlights can be analyzed based on syntactic contents from video and audio streams.
Keywords:Sports video   Multi-modal   Semantic analysis   Syntactic shot
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《计算机科学》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号