期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李朝晖余英林《中国图象图形学报》2005,10(4):457-462,i003

视频数据中的文本能提供重要的语义信息。本文提出了一种视频文本自动定位、跟踪和识别的方法，首先用基于小波和LH检测视频帧文本所在的位置，然后用运动估计的方法，跟踪后继帧文本的位置，再用多帧平均的方法增强文本区域，最后经过二值化处理和连通分量分析，将文本字符送入OCR软件进行识别。实验结果表明，该方法简单易行，能快速地定位和跟踪文本区域，定位精度和识别效果良好。相似文献

2.

Logistic视频字幕增强模型

下载免费PDF全文

李钦瑞吕学强李卓刘坤《中国图象图形学报》2014,19(5):683-692

目的：为提高复杂背景下的视频字幕在OCR中的识别率,需要对提取的视频字幕进行有效地字幕增强。该文首次将Logistic模型应用到视频字幕增强中,提出了基于Logistic模型的融合多帧信息的视频字幕增强方法。方法：对字幕进行检测与跟踪,将出现在连续多帧中的同一字幕片段进行对齐;通过分析字幕片段在多帧中信息,提出字幕背景在时域上的变化特征、背景和字幕文本的固有特征,并将三个特征进行量化与融合,构建适用于字幕增强的Logistic模型,实现对视频字幕的增强。结果：对含阴影或描边效果的特殊复杂背景字幕、普通复杂背景字幕、单一背景字幕分别进行实验,增强后的字幕在OCR软件中的识别正确率分别为81.76%、97.13%、98.19%,与对比方法比较均有一定的提高。结论：实验结果表明,该文方法既可以降低字幕背景的复杂度,又可以提高字幕背景与文本的对比度,从而可以对复杂背景和单一背景下的视频字幕进行有效地增强。相似文献

3.

基于形态学的视频文本自动检测 总被引：2，自引：0，他引：2

李朝晖余英林黄海康《计算机应用研究》2005,22(2):258-260

视频数据中的文本可提供重要的语义信息。该方法首先用形态算子提取视频帧的高频分量,再通过区域标记、连通分量分析、形态后处理等一系列步骤对视频帧进行滤波,得到视频文本检测结果,最后再对其进行二值化处理,把文本字符从复杂背景中分离出来。这种算法能快速地定位文本区域,且不受文本颜色、语种、字体大小、排列方向、文本形变的影响。实验表明,该算法对视频文本进行检测定位精度较高,分割效果良好。相似文献

4.

基于灰度差分和二维最大熵阈值的新闻字幕检测*

陈树越张世林《计算机应用研究》2011,28(8):3195-3197

针对新闻视频帧中文本区域的定位提取问题,提出了一种有效的字幕定位提取方法。通过灰度差分和变异灰度直方图对新闻视频帧字幕区域定位,再经改进的二维最大熵阈值方法对分割出的文字区域进行二值化,得到可识别的文字图片。最后对文本定位和OCR识别情况进行了算法对比。实验表明：与传统的投影法和最大熵方法相比,该方法可有效地提高文本定位的查全率和OCR的识别率。相似文献

5.

基于文字混合特征的视频文本定位研究

赵超方向忠《微计算机信息》2009,25(18)

针对视频中文本信息在视频序列和视频索引中的重要性,本文提出了一种基于文字混合特征的文本定位算法.该算法首先对视频序列中每隔25帧的单帧图像进行边缘检测和投影处理来提取文本块,然后用支持向量基进行筛选,排除非文本块的干扰,最后利用视频序列中相邻帧之间的相关性来搜索剩余帧中的文本块.本文的算法在提高检测速度的同时保证了较高的检测准确度. 相似文献

6.

视频文本检测和识别技术研究

下载免费PDF全文

朱成军李超熊璋《计算机工程》2007,33(10):218-219

视频中的文本提供了描述视频内容的有用信息，对于构建基于高级语义的多媒体检索系统具有重要作用。该文从视频文本的特点出发，分析了视频文本检测和识别的各种技术方法及优缺点，以及该领域国内外的发展现状和下一步研究的重点方向。相似文献

7.

基于多帧分析的视频文本分割和增强

许剑峰黎绍发《计算机工程》2006,32(9):209-210

提出了一种将垂直颜色边缘与分块多帧分析的文本定位与增强的方法。根据文本的垂直颜色边缘特征进行粗筛选，获得和跟踪文本候选区；然后通过分块多帧分析对文本进行增强。实验表明，该方法能有效去除复杂背景，提高视频文本的识别率。相似文献

8.

基于边缘信息和LH的视频文本自动检测

李朝晖余英林《计算机应用研究》2004,21(12):166-167

视频数据中的文本能提供重要的语义信息。针对视频中的文本检测问题,提出了用基于边缘信息和LH的方法检测视频帧文本所在的位置,方法简单,能快速地定位文本区域,且不受文本颜色、语种、文本字体大小的限制。检测和分割效果良好。相似文献

9.

一种高速密集视频监控场景背景重构方法^*

王创新《数据采集与处理》2012,27(3):346-352

针对高速密集视频监控序列建立了一种新的简单的背景重构方法。该方法首先基于帧差序列的时空分布特性,利用高阶统计量理论,获取视频序列公共背景区域;然后根据同一背景帧差图像分布特性相似性,去除运动对于背景的干扰,形成路面背景序列值,从而获得路面背景图像;最后利用计分牌监测的自适应背景更新方法进行背景更新。实验结果表明该方法效果理想,为高速路视频背景重建和运动目标检测提供了新的方法。相似文献

10.

基于灰度差分的新闻视频标题字幕探测

陈树越张世林《计算机与数字工程》2010,38(11):145-147,151

为实现新闻视频图像中标注文本的快速检测与定位,提出了一种有效的字幕定位方法。该方法通过灰度差分统计对视频帧中文字区域进行行定位,再利用行定位信息得到的子图像在垂直方向的投影进行列定位,最后对预处理结果进行过滤和合并得到文字区域定位的精确结果。实验结果表明：该方法效果良好,不受文字大小影响,不受图像背景复杂度限制,方便快捷。相似文献

11.

一种新的彩色图象文字提取算法 总被引：3，自引：0，他引：3

刘文萍付晓玲赵会群李晓丽《计算机工程与应用》2005,41(21):79-82

文字信息在描述图象内容时起着重要的作用,因此文字提取及识别是基于内容视频检索的关键技术。提出了一个从彩色图象背景中提取文字的快速而有效的算法。由于文本字符串的对比度较高,首先用一个改进的sobel算子将彩色图象变换为二值的边缘图象,再对该边缘图象进行涂抹处理,然后基于候选文本区的特征从不同复杂度的彩色图象中提取文本信息,最后将提取出的文本输入到文字识别(OCR)引擎,识别结果证明了此方法的有效性。相似文献

12.

Video text detection and segmentation for optical character recognition 总被引：1，自引：0，他引：1

Chong-Wah Ngo Chi-Kwong Chan 《Multimedia Systems》2005,10(3):261-272

In this paper, we present approaches to detecting and segmenting text in videos. The proposed video-text-detection technique is capable of adaptively applying appropriate operators for video frames of different modalities by classifying the background complexities. Effective operators such as the repeated shifting operations are applied for the noise removal of images with high edge density. Meanwhile, a text-enhancement technique is used to highlight the text regions of low-contrast images. A coarse-to-fine projection technique is then employed to extract text lines from video frames. Experimental results indicate that the proposed text-detection approach is superior to the machine-learning-based (such as SVM and neural network), multiresolution-based, and DCT-based approaches in terms of detection and false-alarm rates. Besides text detection, a technique for text segmentation is also proposed based on adaptive thresholding. A commercial OCR package is then used to recognize the segmented foreground text. A satisfactory character-recognition rate is reported in our experiments.Published online: 14 December 2004 相似文献

13.

一种基于学习的视频字幕验证方法 总被引：1，自引：0，他引：1

下载免费PDF全文

王勇李建彬胡德文郑辉《中国图象图形学报》2006,11(11):1645-1649

视频字幕验证是字幕检测中的重要环节，其目的在于提高检测准确率。当前的验证方法多是依据经验规则。这些方法在图像背景复杂、图像分辨率低以及字幕字体、大小、颜色多变这些条件下，适应性差。为提高验证方法的适应性和准确性，通过将2维主成分分析（2DPCA）应用到视频字幕验证中，提出了一种基于2DPCA和支撑向量机（SVM）的视频字幕验证方法。该方法分训练和判别两个步骤，即首先采用2DPCA方法提取视频图像块特征，然后通过训练SVM对图像块进行验证和分类。实验结果表明．在图像背景复杂、图像分辨率低以及字幕字体、大小、颜色多变这些传统验证方法或多或少都存在困难的条件下，该方法不仅具有良好的视频字幕验证能力，而且也能明显降低算法的运行耗时。相似文献

14.

Extraction and recognition of artificial text in multimedia documents 总被引：1，自引：0，他引：1

C.?Wolf jolion}@rfv.insa-lyon.fr" title="{wolf jolion}@rfv.insa-lyon.fr" itemprop="email" data-track="click" data-track-action="Email author" data-track-label="">Email author J.-M.?Jolion 《Pattern Analysis & Applications》2004,6(4):309-326

Abstract The systems currently available for contentbased image and video retrieval work without semantic knowledge, i. e. they use image processing methods to extract low level features of the data. The similarity obtained by these approaches does not always correspond to the similarity a human user would expect. A way to include more semantic knowledge into the indexing process is to use the text included in the images and video sequences. It is rich in information but easy to use, e. g. by key word based queries. In this paper we present an algorithm to localise artificial text in images and videos using a measure of accumulated gradients and morphological processing. The quality of the localised text is improved by robust multiple frame integration. A new technique for the binarisation of the text boxes based on a criterion maximizing local contrast is proposed. Finally, detection and OCR results for a commercial OCR are presented, justifying the choice of the binarisation technique.An erratum to this article can be found at 相似文献

15.

图像和视频中的文字获取技术 总被引：6，自引：0，他引：6

下载免费PDF全文

王勇郑辉胡德文《中国图象图形学报》2004,9(5):532-538

许多图像都包含丰富的文字信息，如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别，对图像高层语义内容的自动理解、索引和检索非常有价值，因此引起国内外众多学者的研究兴趣。为使人们对该领域有一个系统的了解，并使该领域研究人员有所借鉴，在对目前国内外图像和视频中文字获取技术相关文献综合理解的基础上，综述了该领域的发展现状，同时从文字检测、抽取和文字识别两个方面，重点讨论了其主要的技术方法及应用优缺点，并结合当前面临的问题，指出今后可进一步研究的方向。相似文献

16.

基于多帧图像的视频文字跟踪和分割算法 总被引：8，自引：2，他引：6

密聪杰刘洋薛向阳《计算机研究与发展》2006,43(9):1523-1529

视频中文字的提取是视频语义理解和检索的重要信息来源．针对视频中的静止文字时间和空间上的冗余特性,以文字区域的边缘位图为特征对检测结果作精化,并提出了基于二分搜索法的快速文字跟踪算法,实现了对文字对象快速有效的定位．在分割阶段,除了采用传统的灰度融合图像进行文字区域增强方法,还结合边缘位图对文字区域进行进一步的背景过滤．实验表明,文字的检测精度和分割质量都有很大提高．相似文献

17.

中文文本图像倒置快速检测算法

曾凡锋张国锋陈侃《计算机工程与设计》2012,33(9):3512-3516

针对图像处理(如OCR技术)对图像方向要求十分严格,文本图像方向具有不确定性的问题,提出了中文文本图像倒置快速检测算法.利用投影技术定位出文本字符,结合中文字符及标点符号结构特征,筛选出文本图像中的标点符号,根据标点符号像素分布特点判断出类型,结合标点符号的使用习惯,采用统计的方法判断中文文本图像是否倒置.实验结果表明,投影方法可以不用基于内容达到高效快速的要求,利用统计方法可以保证判别率,该方法可用于OCR预处理过程. 相似文献

18.

一种基于形态变换的复杂背景字符笔画提取方法

邓锐江立胡金柱《计算机工程与应用》2004,40(9):90-93

OCR软件对图像背景的字符的处理能力有限,为了提高OCR的识别率必须对字符进行预处理。该文提出采用SUSAN拐角检测算法生成图像字符区域的拐角响应图,然后利用拐角过滤算法去除错误的拐角响应生成字符候选区域,最后应用了形态数学变换将字符笔画精确地分离出。经实验检验本算法较好地完成字符笔画提取,是一种提高OCR软件识别率的有效方法。相似文献