共查询到19条相似文献,搜索用时 78 毫秒
1.
基于内容的新闻视频故事分段和检索 总被引:7,自引:0,他引:7
首先定义了新闻视频数据库系统的基本结构,接着介绍了实际新闻视频事故分段和检索所运用的文字提取、语音识别等核心技术的基本思想。最后给出了典型的实验结果。 相似文献
2.
根据视频相机拍摄的多种画面进行识别是一个具有挑战性的研究课题。由于相机可以记录并利用画面之间的覆盖区域来改善文本图像的质量,以识别文本中较长的线段。在相机抖动产生的失真得到补偿之后,视频画面就应该被记录,如拼接。本文提出了一种拼接识别技术来描述视频拼接和文本识别,同时,通过基于程序的最佳算法使问题得到解决。实验显示,当画面受到各种失真,如旋转、按比例描述、转换以及非线性相机运动速率波动时,本文的方法可以获取良好的拼接图像,其失真的精确评估达到90%,字符识别的正确率超过95%。 相似文献
3.
4.
1.引言面对日益庞大的信息量,如何有效地检索到感兴趣的内容是至关重要的。新闻视频、音频(包括电视、广播)与文字报道相比,更为生动,表达更为丰富,但也有数据量大、难以组织、索引、检索等缺点。这主要体现在两方面; 文本有标题、段等明显的辅助标记,而视频、音频则没有。一般的浏览工具只有播放、快进、快退、拖动定位等简单手段。这对于几十、几百小时,而且还在日益增长的视频、音频数据库,是远远不能满足要求的。 相似文献
5.
视频分段技术是未来信息高速公路上基于内容视频检索服务的基本和关键技术。介绍了目前几类视频分段方法的基本思想,并主要讨论了基于全图象的视频突变和渐变分段方法。 相似文献
6.
7.
根据使用的压缩域上的信息将当前国内外的视频分段技术划分为5种类型,介绍了各种研究方法的特点及其不足之处,分析了当前视频分段技术的研究现状和存在问题,并对其研究前景进行了探讨。 相似文献
8.
针对日益庞大的视频数据库,特定信息的检索变得越来越困难,要进行视频检索,首先要对视频进行分段,为此文章设计了一个视频分段播放系统。 相似文献
9.
近年来在大词汇连续语音识别的研究取得了长足的进步,隐马尔柯夫模型(HMM)是连续语音识别的核心部分。但是HMM对语音信号的描述不完善,为此人们提出了很多替代模型,其中一类将语音信号描述为长度随机的特征矢量序列,称为随机分段模型(Stochastic Segment Models),简称为分段模型(SM)。该文将首先阐述分段模型的原理,并将分段模型和隐马尔柯夫模型进行比较,其次给出基于分段模型的识别和模型训练算法,最后给出实验结果并进行了讨论。 相似文献
10.
11.
基于梯度增强的新闻字幕分割算法 总被引:2,自引:0,他引:2
新闻字幕的分割在基于语义的新闻视频检索系统中具有重要的意义,为此提出一种基于梯度增强的新闻字幕分割箅法.该算法使用图像多方向梯度的加权和代替图像的标准方差,通过各方向权值的调节加强某些方向的边缘信息,以提高分割效果.与一些经典的自适应阈值分割算法相比,该算法不仅能够保留大部分笔画,也能有效地减少断笔问题.基于光学文字识别的实验结果证明了文中算法的有效性. 相似文献
12.
一种视频中字符的集成型切分与识别算法 总被引:3,自引:0,他引:3
视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率. 相似文献
13.
Albanese Massimiliano Chianese Angelo Moscato Vincenzo Sansone Lucio 《Multimedia Tools and Applications》2004,24(3):253-272
The first step in a video indexing process is the segmentation of videos into meaningful parts called shots. In this paper we present a formal model of the video shot segmentation process. Starting from a mathematical characterization of the most common transition effects, a video segmentation algorithm capable to detect both abrupt and gradual transitions is proposed. The proposed algorithm is based on the computation of an arbitrary similarity measure between consecutive frames of a video. The algorithm has been tested adopting a similarity metric based on the Animate Vision theory and results have been reported. 相似文献
14.
典型视频镜头分割方法的比较 总被引:16,自引:3,他引:13
视频镜头分割作为视频处理的第一步,一直受到学者的关注和重视,数十年来已提出了大量的算法。该文对几种常用的视频分割算法作了综述,分析了基于直方图的算法、基于运动的算法、基于轮廓的算法、以及直接针对压缩视频的算法等典型算法的特征,并详细研究了各种算法中帧差异值的计算和阈值设定的方法,比较了它们的优缺点,最后对视频分割算法研究作了展望。 相似文献
15.
16.
17.
为了促进语音识别技术在实际中的应用,利用文音相似度的概念,提出了基于文音相似度的语音查号系统的设计开发方法。实验表明,这种方法可以大幅提高语音查号系统的查询成功率。 相似文献
18.
基于自动镜头分割的视频压缩编码算法 总被引:4,自引:0,他引:4
将镜头分割引入压缩编码,针对分割镜头特性确定适当的编码器及参数,能够提高视频压缩编码的效率.为此,提出了一种基于对分查找的镜头分割算法(VSSB)以及关键帧频率计算公式.其算法的核心是通过对分查找形成二叉树,同时通过广度优先搜索寻找分割点,具有O(log n)的时间复杂性.针对实时应用,采用了双阈值比较的镜头分割算法,能够较好地实现镜头切变和渐变的检测.基于镜头分割算法,建立并实现了并行方式的编解码系统模型.实验证明,基于镜头分割的编码方法能够提高压缩比,缩短压缩编码时间,有利于改善重建图像质量。 相似文献
19.
随着语音识别研究的深入,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务,结合相应的背景,采取相应的措施,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形,利用文本在发音上的相似度可以大大提高识别的精度。本文首先介绍了文音相似度的概念,然后给出了利用文音相似度设计开发语音查询系统的过程和例子。 相似文献