首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基于内容的新闻视频故事分段和检索   总被引:7,自引:0,他引:7  
首先定义了新闻视频数据库系统的基本结构,接着介绍了实际新闻视频事故分段和检索所运用的文字提取、语音识别等核心技术的基本思想。最后给出了典型的实验结果。  相似文献   

2.
根据视频相机拍摄的多种画面进行识别是一个具有挑战性的研究课题。由于相机可以记录并利用画面之间的覆盖区域来改善文本图像的质量,以识别文本中较长的线段。在相机抖动产生的失真得到补偿之后,视频画面就应该被记录,如拼接。本文提出了一种拼接识别技术来描述视频拼接和文本识别,同时,通过基于程序的最佳算法使问题得到解决。实验显示,当画面受到各种失真,如旋转、按比例描述、转换以及非线性相机运动速率波动时,本文的方法可以获取良好的拼接图像,其失真的精确评估达到90%,字符识别的正确率超过95%。  相似文献   

3.
朱成军  李超  熊璋 《计算机工程》2007,33(10):218-219
视频中的文本提供了描述视频内容的有用信息,对于构建基于高级语义的多媒体检索系统具有重要作用。该文从视频文本的特点出发,分析了视频文本检测和识别的各种技术方法及优缺点,以及该领域国内外的发展现状和下一步研究的重点方向。  相似文献   

4.
1.引言面对日益庞大的信息量,如何有效地检索到感兴趣的内容是至关重要的。新闻视频、音频(包括电视、广播)与文字报道相比,更为生动,表达更为丰富,但也有数据量大、难以组织、索引、检索等缺点。这主要体现在两方面; 文本有标题、段等明显的辅助标记,而视频、音频则没有。一般的浏览工具只有播放、快进、快退、拖动定位等简单手段。这对于几十、几百小时,而且还在日益增长的视频、音频数据库,是远远不能满足要求的。  相似文献   

5.
胡宏斌  周洞汝 《计算机工程》2000,26(10):140-142
视频分段技术是未来信息高速公路上基于内容视频检索服务的基本和关键技术。介绍了目前几类视频分段方法的基本思想,并主要讨论了基于全图象的视频突变和渐变分段方法。  相似文献   

6.
本系统采用RSC-164单片机作为语音识别芯片.结合时间规整(DTW)技术和结合模块匹配法.对语音频谱信号建立隐含马可夫模型,能识别操作者预先录制的语音命令.命令识别后输出特征信号.通过89C51单片机对输出信号的检测.用位操作的形式实现对音频、视频系统进行语音控制。本系统可以扩展到对其他系统或机器上应用控制。  相似文献   

7.
根据使用的压缩域上的信息将当前国内外的视频分段技术划分为5种类型,介绍了各种研究方法的特点及其不足之处,分析了当前视频分段技术的研究现状和存在问题,并对其研究前景进行了探讨。  相似文献   

8.
针对日益庞大的视频数据库,特定信息的检索变得越来越困难,要进行视频检索,首先要对视频进行分段,为此文章设计了一个视频分段播放系统。  相似文献   

9.
近年来在大词汇连续语音识别的研究取得了长足的进步,隐马尔柯夫模型(HMM)是连续语音识别的核心部分。但是HMM对语音信号的描述不完善,为此人们提出了很多替代模型,其中一类将语音信号描述为长度随机的特征矢量序列,称为随机分段模型(Stochastic Segment Models),简称为分段模型(SM)。该文将首先阐述分段模型的原理,并将分段模型和隐马尔柯夫模型进行比较,其次给出基于分段模型的识别和模型训练算法,最后给出实验结果并进行了讨论。  相似文献   

10.
基于形态学的视频文本自动检测   总被引:2,自引:0,他引:2  
视频数据中的文本可提供重要的语义信息。该方法首先用形态算子提取视频帧的高频分量,再通过区域标记、连通分量分析、形态后处理等一系列步骤对视频帧进行滤波,得到视频文本检测结果,最后再对其进行二值化处理,把文本字符从复杂背景中分离出来。这种算法能快速地定位文本区域,且不受文本颜色、语种、字体大小、排列方向、文本形变的影响。实验表明,该算法对视频文本进行检测定位精度较高,分割效果良好。  相似文献   

11.
基于梯度增强的新闻字幕分割算法   总被引:2,自引:0,他引:2  
新闻字幕的分割在基于语义的新闻视频检索系统中具有重要的意义,为此提出一种基于梯度增强的新闻字幕分割箅法.该算法使用图像多方向梯度的加权和代替图像的标准方差,通过各方向权值的调节加强某些方向的边缘信息,以提高分割效果.与一些经典的自适应阈值分割算法相比,该算法不仅能够保留大部分笔画,也能有效地减少断笔问题.基于光学文字识别的实验结果证明了文中算法的有效性.  相似文献   

12.
一种视频中字符的集成型切分与识别算法   总被引:3,自引:0,他引:3  
杨武夷  张树武 《自动化学报》2010,36(10):1468-1476
视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率.  相似文献   

13.
The first step in a video indexing process is the segmentation of videos into meaningful parts called shots. In this paper we present a formal model of the video shot segmentation process. Starting from a mathematical characterization of the most common transition effects, a video segmentation algorithm capable to detect both abrupt and gradual transitions is proposed. The proposed algorithm is based on the computation of an arbitrary similarity measure between consecutive frames of a video. The algorithm has been tested adopting a similarity metric based on the Animate Vision theory and results have been reported.  相似文献   

14.
典型视频镜头分割方法的比较   总被引:16,自引:3,他引:13  
视频镜头分割作为视频处理的第一步,一直受到学者的关注和重视,数十年来已提出了大量的算法。该文对几种常用的视频分割算法作了综述,分析了基于直方图的算法、基于运动的算法、基于轮廓的算法、以及直接针对压缩视频的算法等典型算法的特征,并详细研究了各种算法中帧差异值的计算和阈值设定的方法,比较了它们的优缺点,最后对视频分割算法研究作了展望。  相似文献   

15.
视频中的文字探测   总被引:12,自引:0,他引:12  
视频中出现的文字往往包含大量的信息 ,是视频分析的重要语义线索 ,探测并识别出来的文字可以为基于内容的视频检索提供索引 .本文简要介绍了目前现有的一些文字探测的方法 ,结合视频中出现的文字的特点 ,提出了一种较为高效的视频文字探测方法 ,该方法在一般图像质量的条件下对中、英文文字都有较好的探测效果 .文章给出了实验结果并对相关问题进行了讨论  相似文献   

16.
基于笔画提取和颜色模型的视频文字分割算法   总被引:1,自引:0,他引:1       下载免费PDF全文
程豪  黄磊  刘金刚 《计算机工程》2009,35(4):193-195
提出综合利用视频文字时空、笔画、颜色和几何特征的文字分割算法,快速准确地从复杂背景的视频图像中分割出文字。利用多帧融合进行图像增强,基于笔画宽度特征,使用笔画特征算子提取文字笔画,根据笔画图标注的文字区域建立颜色模型,提取文字颜色层,并用改进的连通域分析法去除文字颜色层中的同色背景和噪声。实验结果表明,该算法比传统算法能更好解决复杂背景的视频文字分割问题。  相似文献   

17.
为了促进语音识别技术在实际中的应用,利用文音相似度的概念,提出了基于文音相似度的语音查号系统的设计开发方法。实验表明,这种方法可以大幅提高语音查号系统的查询成功率。  相似文献   

18.
基于自动镜头分割的视频压缩编码算法   总被引:4,自引:0,他引:4  
将镜头分割引入压缩编码,针对分割镜头特性确定适当的编码器及参数,能够提高视频压缩编码的效率.为此,提出了一种基于对分查找的镜头分割算法(VSSB)以及关键帧频率计算公式.其算法的核心是通过对分查找形成二叉树,同时通过广度优先搜索寻找分割点,具有O(log n)的时间复杂性.针对实时应用,采用了双阈值比较的镜头分割算法,能够较好地实现镜头切变和渐变的检测.基于镜头分割算法,建立并实现了并行方式的编解码系统模型.实验证明,基于镜头分割的编码方法能够提高压缩比,缩短压缩编码时间,有利于改善重建图像质量。  相似文献   

19.
随着语音识别研究的深入,提高通用识别引擎的精度变得越来越困难。但对具体的语音识别任务,结合相应的背景,采取相应的措施,有可能达到很理想的识别精度。在已知语音输入为某有限集元素之一的情形,利用文本在发音上的相似度可以大大提高识别的精度。本文首先介绍了文音相似度的概念,然后给出了利用文音相似度设计开发语音查询系统的过程和例子。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号