共查询到20条相似文献,搜索用时 15 毫秒
1.
字幕信息有助于观众对音视频内容进行理解,在音视频文件中起着不可或缺的作用.针对自动字幕生成系统的要求,提出了一种灵活、高效的语音端点检测算法,可以在复杂背景噪声的情况下,从连续的音频信号中提取语音端点.将短时能量、短时过零率、短时信息熵这3种基本音频参数进行结合,形成新的音频特征参数:短时能零熵(EZE-feature),在结合了音频信号时域特征和频域特征优点的同时,规避了它们各自的不足.在此基础上,还提出了一种环境自适应的语音端点判定算法,在端点检测过程中对背景噪声进行实时分析,并根据背景噪声的变化对短时能零熵参数进行调整.该语音端点检测算法已被成功应用于自动字幕生成系统中. 相似文献
2.
结合科普书屋采用Flash Media Server构建了一套基于互连网的语音视频通信系统,并给出该系统的具体实现方法.系统几乎可以与目前互联网上流行的语音视频通信系统相媲美,为视频监控、视频会议、聊天室等应用系统的开发提供了参考. 相似文献
3.
4.
简要介绍了现有视频字幕的检测提取方法及独立成分分析的基本理论和算法,探讨了独立成分分析在视频图像序列处理方面的应用,提出了一种基于独立成分分析的新的视频字幕检测提取方法。仿真实验结果表明,在图像背景复杂、图像分辨率低以及字幕字体、大小、颜色多变这些传统检测提取方法或多或少都存在困难的条件下,该方法都具有良好的视频字幕检测提取能力。 相似文献
5.
老式视频中固化的字幕影响了不同语种间视频的交流和处理。论文基于视频字幕的特点,提出了一种视频字幕的定位及提取方法,并结合图像修复技术,实现了一个自动视频字幕去除系统。实验结果表明,该系统能够较好地去除字幕。 相似文献
6.
远程教育中,视频媒体若配有同步字幕,在讲解专业性词语、教师方言偏重和学生听力有障碍等情况下会起到很好的辅助教学效果.但是常用制作字幕软件的效率并不高。本文提出了利用雷特视频TGA唱词生成系统快速制作同步字幕.同时将制作的字幕导入到非线性编辑软件Premiere中进行同步适配,从而高效低价地给远程视频加上同步字幕,提高教学效果。 相似文献
7.
8.
9.
10.
针对传统方法中固定位置的字幕可能遮挡视频中观众感兴趣内容的问题,提出一种基于视频内容的动态字幕添加方法.通过综合考虑视频内容的重要性、视频画面之间以及相邻字幕间的连贯性来确定视频中视觉相对次要的区域,并在该区域添加字幕,有效地减少了字幕对关键内容形成的遮挡;并提出了随视频内容动态确定字幕颜色以及通过对固定颜色描边2种方... 相似文献
11.
中等词汇的汉英语音翻译系统 总被引:1,自引:0,他引:1
本文给出汉英语音翻译系统的组成,介绍了系统中连续汉语语音识别和汉英机器翻译的工作;我们已经在限定主题、中等词汇量的条件下实现了非特定人的连续语音识别,实现了汉英语音翻译实验演示系统。 相似文献
12.
13.
视频中的字幕对多媒体检索技术提供了重要的信息,主要介绍视频字幕识别技术中的特征提取方法.根据字幕不同于印刷体和手写体中常出现的问题,提出了字符位置特征和字符区域笔画分布特征、字符笔画密度特征两种修改过的特征提取方法与传统的字符外围特征结合使用,并进行了实验测试,结果表明这些方法对字幕识别是可行的. 相似文献
14.
15.
一种快速新闻视频标题字幕探测与定位方法* 总被引:1,自引:0,他引:1
新闻视频字幕包含有丰富的语义信息,尤其是标题字幕,对新闻视频高层语义内容的分析和理解具有
重要作用。利用标题字幕的时空分布特征,提出了一个新闻视频标题字幕的快速探测与定位方法。首先利用标
题字幕持续多帧出现的特点降低所需处理的帧数,然后基于标题字幕的边缘特征和位置特征,标记帧图像的候
选字幕块,对帧序列中的图像进行统计分析,探测出视频中标题字幕的位置及出现消失时间。实验结果表明所
提方法简单有效,能够快速、鲁棒地探测并定位新闻视频中的标题字幕。 相似文献
16.
视频字幕验证是字幕检测中的重要环节,其目的在于提高检测准确率。当前的验证方法多是依据经验规则。这些方法在图像背景复杂、图像分辨率低以及字幕字体、大小、颜色多变这些条件下,适应性差。为提高验证方法的适应性和准确性,通过将2维主成分分析(2DPCA)应用到视频字幕验证中,提出了一种基于2DPCA和支撑向量机(SVM)的视频字幕验证方法。该方法分训练和判别两个步骤,即首先采用2DPCA方法提取视频图像块特征,然后通过训练SVM对图像块进行验证和分类。实验结果表明.在图像背景复杂、图像分辨率低以及字幕字体、大小、颜色多变这些传统验证方法或多或少都存在困难的条件下,该方法不仅具有良好的视频字幕验证能力,而且也能明显降低算法的运行耗时。 相似文献
17.
基于支持向量机的视频字幕自动定位与提取 总被引:23,自引:4,他引:23
视频字幕蕴含了丰富语义 ,可用于对相应视频流进行高级语义标注 .文中首先将原始图像帧分割为 N× N的子块 ,提取每个子块的灰度特征 ;然后使用预先训练好的 SVM分类机进行字幕子块和非字幕子块的分类 ;最后结合金字塔模型和后期处理过程 ,实现视频图像字幕区域的自动定位提取 .实验表明文中方法取得了良好的效果 相似文献
18.
视频中滚动字幕通常表达一段完整信息,对其进行检测与跟踪是字幕识别与应用的重要前提.通过分析视频中滚动字幕的特征,在Sobel边缘检测的基础上,提出规则和统计结合的字幕检测方法及垂直边缘特征最小差平方和的字幕跟踪方法.从视频全局角度出发,对相邻帧的边缘图像进行差分,选取水平边缘特征并根据规则检测字幕区域的候选边界,通过统计边界出现频数,定位滚动字幕区域;计算相邻滚动字幕条在不同偏移值下垂直边缘特征差平方和,取其最小值作为相邻字幕的偏移量,从而实现字幕的跟踪.实验结果显示,该文方法从含有多种字幕类型的视频中检测出滚动字幕的准确率可达96.61%、字幕跟踪的准确率达99.43%,充分说明文中方法的有效性. 相似文献
19.
谢小粮 《数字社区&智能家居》2011,(9X):6750-6751
在视频节目播放中,字幕是一个非常重要的环节,丰富多彩的字幕既可活跃屏幕,也可突出主题,起到了画龙点睛的作用,也是电视媒体用其传播信息,架起与观众构通的桥梁。所以,字幕在视频节目制作中占有很重要的位置。该文就视频节目制作中字幕的字体选择、字幕与画面的协调统一、字幕的色彩设计、字幕的编排和出入方式等几个方面的内容探讨了视频节目播放中字幕的设计与应用。 相似文献
20.
视频字幕在传递信息的同时,固化在视频中的字幕也阻碍了视频的重复利用。提出一种基于时空解耦Transformer的视频字幕去除算法,能够从带有字幕文本的视频序列中去除字幕文本,并重建出被字幕区域遮挡的背景图像。整体框架分为两个部分,字幕掩膜提取模块和字幕去除模块,前者快速精准地获得输入视频序列的二值字幕掩膜,将得到的二值字幕掩膜作为辅助信息,输入到基于时空解耦Transformer的字幕去除模块,进行字幕文本的去除和背景纹理的恢复,实现对整体视频字幕的去除。与现有的经典视频字幕去除方法相比,在峰值信噪比和结构相异性等图像质量指标以及视觉效果上,该方法均取得了更好的性能,实验结果验证了该方法在视频字幕去除领域的有效性。 相似文献