首页 | 本学科首页   官方微博 | 高级检索  
     

多层视频语义概念分析与理解
引用本文:魏维,邹书蓉,刘凤玉.多层视频语义概念分析与理解[J].计算机辅助设计与图形学学报,2008,20(1):85-92.
作者姓名:魏维  邹书蓉  刘凤玉
作者单位:1. 南京理工大学计算机科学与技术学院,南京,210094;成都信息工程学院计算机科学与技术系,成都,610225
2. 成都信息工程学院计算机科学与技术系,成都,610225
3. 南京理工大学计算机科学与技术学院,南京,210094
基金项目:国家自然科学基金 , 四川省教育厅资助项目 , 成都信息工程学院校科研和教改项目
摘    要:基于统计学理论,提出了一种视频多粒度语义分析的通用方法,使得多层次语义分析与多模式信息融合得到统一.为了对时域内容进行表示,首先提出一种具有时间语义语境约束的关键帧选取策略和注意力选择模型;在基本视觉语义识别后,采用一种多层视觉语义分析框架来抽取视觉语义;然后应用隐马尔可夫模型(HMM)和贝叶斯决策进行音频语义理解;最后用一种具有两层结构的仿生多模式融合方案进行语义信息融合.实验结果表明,该方法能有效融合多模式特征,并提取不同粒度的视频语义.

关 键 词:视频语义分析  视频语义概念  层次隐马尔可夫模型  多模式融合
收稿时间:2007-01-22
修稿时间:2007-10-08

Analysis and Understanding for Multi-Level Video Semantic Concepts
Wei Wei,Zou Shurong,Liu Fengyu.Analysis and Understanding for Multi-Level Video Semantic Concepts[J].Journal of Computer-Aided Design & Computer Graphics,2008,20(1):85-92.
Authors:Wei Wei  Zou Shurong  Liu Fengyu
Abstract:Based on statistics theory, a generic method for video multi-granularity semantic analysis is proposed in this paper, where multi-level semantics analysis and multi-modal information fusion are unified to represent temporal content, a key-frame selection strategy with temporal semantic context restriction and an attention selection mode are presented firstly. After recognizing basic visual semantics, a framework for multi-level visual semantics analysis is introduced for visual semantics extraction. Then, Hidden Markov model and Bayesian decision are applied to audio semantic understanding. Finally, a bionic muhimodal fusion scheme with two level structures is used for video semantic information fusion. Experimental results demonstrate the effectiveness of the proposed method to fuse multimodal features, as well as to extract video semantics with different granularity.
Keywords:video semantic analysis  video semantic concept  HHMM  multimodal fusion
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号