一种基于多模态特征的新闻视频语义提取框架 News video semantic extraction framework based on multimodal information期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

一种基于多模态特征的新闻视频语义提取框架

引用本文：	闫建鹏,封化民,刘嘉琦. 一种基于多模态特征的新闻视频语义提取框架[J]. 计算机应用研究, 2012, 29(7): 2725-2729

作者姓名：	闫建鹏封化民刘嘉琦

作者单位：	1. 西安电子科技大学通信工程学院,西安,710071 2. 西安电子科技大学通信工程学院,西安710071;北京电子科技学院,北京100070

基金项目：	国家自然科学基金资助项目（60972139）; 北京市自然科学基金资助项目（4092041）

摘要：	为提高视频语义信息提取准确率,提出了一种基于多模态特征的新闻视频语义提取框架。在视频中提取主题字幕信息,对音频进行分类和语音识别,根据主题字幕信息借助搜索引擎得到与新闻视频相关的网页;最后利用网页文本对语音识别的结果进行纠错,从而通过视频字幕信息和语音脚本的跨模态融合提高视频语义提取的准确率。在中等规模的新闻视频(含新闻网页)库测试表明了该方法的有效性,经纠错后的语音识别准确率达到了65%左右。
关键词：	多模态特征语义分析视频检索
News video semantic extraction framework based on multimodal information

YAN Jian-peng,FENG Hua-min,LIU Jia-qi. News video semantic extraction framework based on multimodal information[J]. Application Research of Computers, 2012, 29(7): 2725-2729

Authors:	YAN Jian-peng FENG Hua-min LIU Jia-qi

Affiliation:	1. School of Telecommunication Engineering, Xidian University, Xi'an 710071, China; 2. Beijing Electronic Science & Technology Institution, Beijing 100070, China

Abstract:

Keywords:	multimodel feature semantic analysis video retrieval
本文献已被 CNKI 万方数据等数据库收录！
	点击此处可从《计算机应用研究》浏览原始摘要信息
	点击此处可从《计算机应用研究》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏