首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于多模态特征的新闻视频语义提取框架
引用本文:闫建鹏,封化民,刘嘉琦. 一种基于多模态特征的新闻视频语义提取框架[J]. 计算机应用研究, 2012, 29(7): 2725-2729
作者姓名:闫建鹏  封化民  刘嘉琦
作者单位:1. 西安电子科技大学通信工程学院,西安,710071
2. 西安电子科技大学通信工程学院,西安710071;北京电子科技学院,北京100070
基金项目:国家自然科学基金资助项目(60972139); 北京市自然科学基金资助项目(4092041)
摘    要:为提高视频语义信息提取准确率,提出了一种基于多模态特征的新闻视频语义提取框架。在视频中提取主题字幕信息,对音频进行分类和语音识别,根据主题字幕信息借助搜索引擎得到与新闻视频相关的网页;最后利用网页文本对语音识别的结果进行纠错,从而通过视频字幕信息和语音脚本的跨模态融合提高视频语义提取的准确率。在中等规模的新闻视频(含新闻网页)库测试表明了该方法的有效性,经纠错后的语音识别准确率达到了65%左右。

关 键 词:多模态特征  语义分析  视频检索

News video semantic extraction framework based on multimodal information
YAN Jian-peng,FENG Hua-min,LIU Jia-qi. News video semantic extraction framework based on multimodal information[J]. Application Research of Computers, 2012, 29(7): 2725-2729
Authors:YAN Jian-peng  FENG Hua-min  LIU Jia-qi
Affiliation:1. School of Telecommunication Engineering, Xidian University, Xi'an 710071, China; 2. Beijing Electronic Science & Technology Institution, Beijing 100070, China
Abstract:
Keywords:multimodel feature   semantic analysis   video retrieval
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号