多模态体育视频语义分析 |
| |
作者姓名: | 刘宇驰 栾悉道 戴端辉 吴玲达 |
| |
作者单位: | 国防科学技术大学信息系统与管理学院,长沙,410073;空军雷达学院一系,武汉,430019;国防科学技术大学信息系统与管理学院,长沙,410073;陆军航空兵学院模拟训练中心,北京,101114 |
| |
摘 要: | 以足球运动为例提出了一种体育视频语义结构,并提出相应的语义分析框架。视频被分解为纯视频流和音频流两种模态,每种模态均可依次提取和综合出低层内容和中层内容。视频流可根据低层(物理)内容分割为物理镜头,然后根据特定的中间层内容可以确定为语法镜头。音频也可以在物理特征的基础上形成有意义的中间层内容,如解说员兴奋时的声音。最后,根据视频流和音频流的中间层内容,按照足球比赛转播的规律,分析出比赛中的精彩事件,并选取相关的镜头作为反映此事件的序列组合。
|
关 键 词: | 体育视频 多模态 语义分析 语法镜头 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|