期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

一种新的利用多帧结合检测视频标题文字的算法 总被引：5，自引：0，他引：5

王蓉蓉金万军吴立德《计算机研究与发展》2005,42(7):1191-1197

视频中的标题文字通常在视频信息索引和检索中起到重要作用．提出了一种新的视频标题文字的检测算法．首先采用一种新的多帧结合技术来降低图像背景的复杂度,它基于时间序列对多帧图像进行最小(或最大)像素值搜索,搜索的具体方式由Sobel边缘图来决定．然后以块为单位来进行文字与非文字的分类,即用一扫描窗口对图像进行扫描,以Sobel边缘为特征,判断其是否为文字。一个2级的金字塔被用来检测不同大小的文字．最后,提出一种新的迭代的文字区域分解方法,它能够更精确地定位文字区域的边界．实验结果表明,这种文字检测算法能够取得很高的精度和召回率．相似文献

2.

一种基于HSV空间的彩色边缘图像检索方法 总被引：8，自引：0，他引：8

下载免费PDF全文

杨红颖吴俊峰于永健王向阳《中国图象图形学报》2008,13(10):2035-2038

结合重要的彩色图像边缘及人眼视觉特性,提出了一种基于彩色边缘直方图的图像检索方法。该方法首先利用Canny检测算子提取出原始图像的彩色边缘信息,然后将彩色图像边缘转换至符合人眼视觉特性的HSV空间并进行量化处理,再将彩色边缘划分成圆环区域和角形区域,并分别计算出圆环区域和角形区域的颜色直方图,最后综合利用上述圆环区域和角形区域的颜色直方图计算图像间内容的相似度,并进行彩色图像检索。仿真实验表明,该方法能够准确和高效地查找出用户所需内容的彩色图像,并且具有较好的查准率和查全率。相似文献

3.

基于多帧图像的视频文字跟踪和分割算法 总被引：8，自引：2，他引：6

密聪杰刘洋薛向阳《计算机研究与发展》2006,43(9):1523-1529

视频中文字的提取是视频语义理解和检索的重要信息来源．针对视频中的静止文字时间和空间上的冗余特性,以文字区域的边缘位图为特征对检测结果作精化,并提出了基于二分搜索法的快速文字跟踪算法,实现了对文字对象快速有效的定位．在分割阶段,除了采用传统的灰度融合图像进行文字区域增强方法,还结合边缘位图对文字区域进行进一步的背景过滤．实验表明,文字的检测精度和分割质量都有很大提高．相似文献

4.

利用OCR识别技术实现视频中文字的提取

下载免费PDF全文

陈义李言俊孙小炜《计算机工程与应用》2010,46(10):180-183

为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。相似文献

5.

基于复杂背景的彩色图像中维吾尔文字切分

玛日耶姆古丽·米吉提哈力旦·A 《计算机工程与科学》2012,34(9):98-103

沿着基线并具有大量附加部分书写是维吾尔文一大特点,这些特点使复杂背景的彩色图像中维吾尔文字行与字的切分和识别成为一个既困难又有趣的问题。本文首先对复杂彩色图像进行灰度化,其次将彩色图像转换为灰度化的边缘图像,再对图像进行局域二值化,然后进行区域检测和边缘调整,初步实现了图像中维吾尔文字行的定位,紧接着根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段。实验结果表明,文字行的切分准确率达到96%,字切分准确率达到98%以上。相似文献

6.

面向彩色图像和视频的文本提取新方法 总被引：10，自引：1，他引：10

张引潘云鹤《计算机辅助设计与图形学学报》2002,14(1):36-40

随着基于内容检索技术的发展，人们逐渐意识到包含在彩色图像和视频中的文本具有重要的语义作用，并需要采用有效的方法来提取这些文本，文中提出一个全面作用在RGB颜色空间3个分量上的彩色图像边缘检测新算子和一种利用空间频率特征，结合彩色边缘检测与基于区域图像分割方法的彩色图像和视频文本提取新算法。实验表明在彩色图像和视频的文本提取中，文中算子形成的二值边缘图像的文本区域轮廓清晰完整，有利于下一步文本区域与背景的剥离，该算法具有较高的广西区域提取准确率和较好的对于文本字符在尺寸和颜色方面的适应性。相似文献

7.

视频图像文字检测综述

下载免费PDF全文

周东傲林嘉宇《计算机工程与科学》2015,37(4):760-764

自动从视频图像中提取文字信息,对于监控视频图像内容、添加视频标签和建立视频图像检索系统,有重要的意义。文字检测是文字信息提取系统的前端,是文字信息提取中最关键的一步。近年来,视频图像文字信息检测领域有了新的重要的发展,综述从基于区域和基于纹理的文字检测方法进行归纳、比较和分析,概括了近年来文字检测技术的主要进展。此外,为了突出综合性方法的重要性,对其专门进行了总结。最后对视频图像中的文字检测技术的难点进行总结,并对其发展趋势进行展望。相似文献

8.

基于彩色边缘网格直方图的图像检索方法 总被引：2，自引：0，他引：2

王向阳周璐芦婷婷《小型微型计算机系统》2007,28(9):1705-1709

边缘是图像局部变化最显著的部分,也是人类理解图像内容的重要线索.本文提出了一种基于彩色边缘特征的图像检索方法,该方法首先利用Canny检测算子提取出原始图像的彩色边缘信息,然后将彩色边缘划分成圆环区域和角形区域,并分别计算出圆环区域和角形区域的颜色直方图;最后综合利用上述圆环区域和角形区域的颜色直方图计算图像间内容的相似度,并进行彩色图像检索.仿真实验表明,该方法能够准确和高效地查找出用户所需内容的彩色图像,并且具有较好的查准率和查全率. 相似文献

9.

基于颜色聚类和多帧融合的视频文字识别方法 总被引：1，自引：0，他引：1

易剑彭宇新肖建国《软件学报》2011,22(12):2919-2933

提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果;另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果. 相似文献

10.

基于边缘网格的图像检索算法研究

杨红颖芦婷婷王向阳《中国图象图形学报》2006,11(11):1682-1685

为了准确高效地进行彩色图像检索，结合图像空间分布特性，提出了一种基于边缘刚格的图像检索新算法，不仅利用了彩色边缘的颜色统计信息，而且考虑了彩色边缘像素点的径向与角向分布特性。该算法首先利用Canny检测算子提取出原始图像的彩色边缘信息；然后将整个彩色边缘划分成局部刚格区域，并分别计算出每个网格区域的颜色直方图和纹理直方图；最后综合利用上述网格区域的颜色直方图和纹理直方图来计算图像间内容的相似度，用于进行彩色图像检索。仿真实验表明，该算法不仅能够准确和高效地查找出用户所需内容的彩色图像，并且具有较好的查准率和查全率。相似文献

11.

基于随机投影的场景文本图像聚类方法研究*

徐飞刘家锋张博宇吴锐赵巍《计算机应用研究》2011,28(12):4730-4733

图像中的文本字符存在于杂乱的背景之中,拍摄视角的不同使得文本具有较大的几何变形,再加上存在光照变化、字符颜色不统一等现象会导致背景分离和文本识别困难.为此提出一种基于图像文本区域的图像聚类方法.该方法首先对自然场景图像中已定位的文本区域提取局部特征描述,并使用随机投影方法将局部特征矢量集映射为固定维的特征向量,然后对包含图像文本区域的图像进行聚类.这种方法避免了由图像分割与字符识别带来的困难.实验结果表明,该方法可以对包含文字的自然场景图像有效地进行聚类,聚类的准确率能达到86.66％. 相似文献

12.

Content‐Based Colour Transfer

Fuzhang Wu Weiming Dong Yan Kong Xing Mei Jean‐Claude Paul Xiaopeng Zhang 《Computer Graphics Forum》2013,32(1):190-203

This paper presents a novel content‐based method for transferring the colour patterns between images. Unlike previous methods that rely on image colour statistics, our method puts an emphasis on high‐level scene content analysis. We first automatically extract the foreground subject areas and background scene layout from the scene. The semantic correspondences of the regions between source and target images are established. In the second step, the source image is re‐coloured in a novel optimization framework, which incorporates the extracted content information and the spatial distributions of the target colour styles. A new progressive transfer scheme is proposed to integrate the advantages of both global and local transfer algorithms, as well as avoid the over‐segmentation artefact in the result. Experiments show that with a better understanding of the scene contents, our method well preserves the spatial layout, the colour distribution and the visual coherence in the transfer process. As an interesting extension, our method can also be used to re‐colour video clips with spatially‐varied colour effects. 相似文献

13.

一种视频中字符的集成型切分与识别算法 总被引：3，自引：0，他引：3

杨武夷张树武《自动化学报》2010,36(10):1468-1476

视频文本行图像识别的技术难点主要来源于两个方面: 1)粘连字符的切分与识别问题; 2)复杂背景中字符的切分与识别问题. 为了能够同时切分和识别这两种情况中的字符, 提出了一种集成型的字符切分与识别算法. 该集成型算法首先对文本行图像二值化, 基于二值化的文本行图像的水平投影估计文本行高度. 其次根据字符笔划粘连的程度, 基于图像分析或字符识别对二值图像中的宽连通域进行切分. 然后基于字符识别组合连通域得到候选识别结果, 最后根据候选识别结果构造词图, 基于语言模型从词图中选出字符识别结果. 实验表明该集成型算法大大降低了粘连字符及复杂背景中字符的识别错误率. 相似文献

14.

基于笔画相关加权的视频图像文字识别

苏畅胡晓冬王斌辅尚凤军《计算机应用》2012,32(8):2305-2312

为了提取影视视频图像中的字幕信息,提出一套鲁棒的方法：首先采用图像的边缘特征对字幕信息进行区域定位,并给出结合边缘信息的方法对图像文字进行二值化;其次,采用投影法和区域生成方法定位单个文字;最后,充分考虑到文字笔画的拓扑结构,进行相邻子网格笔画结构相关性的判定,并采用笔画模糊隶属度完成弹性网格特征的提取。该方法在复杂的背景图像中能够有效得到文字的二值图像,并保证了提取特征的稳定性、健壮性,对二值化后的影视字幕的识别率达到92.1%,实验结果表明了方法的有效性。相似文献

15.

AUTOMATIC TEXT LOCATION IN IMAGES AND VIDEO FRAMES

ANIL K. JAIN BIN YU 《Pattern recognition》1998,31(12):2055-2076

Textual data is very important in a number of applications such as image database indexing and document understanding. The goal of automatic text location without character recognition capabilities is to extract image regions that contain only text. These regions can then be either fed to an optical character recognition module or highlighted for a user. Text location is a very difficult problem because the characters in text can vary in font, size, spacing, alignment, orientation, color and texture. Further, characters are often embedded in a complex background in the image. We propose a new text location algorithm that is suitable in a number of applications, including conversion of newspaper advertisements from paper documents to their electronic versions, World Wide Web search, color image indexing and video indexing. In many of these applications, it is not necessary to extract all the text, so we emphasize on extracting important text with large size and high contrast. Our algorithm is very fast and has been shown to be successful in extracting important text in a large number of test images. 相似文献

16.

视频图像中维吾尔文字的识别研究

下载免费PDF全文

艾力·居麦哈力旦·A 黄浩《计算机工程与应用》2011,47(36):190-192

提出了从复杂背景视频图像中提取文字并识别的一套算法,利用自适应迭代算法提取视频中维吾尔文字,针对维吾尔文字的一些特点,利用合适的预处理方法保留维吾尔文字中的各种点及特殊笔画,同时有效地消除了复杂背景带来的噪声。考虑维吾尔文字书写的特点,利用滑动窗口法提取文字特征避免了文字分割,将产生的特征向量输入到隐马尔可夫模型（Hidden Morkov Model）中进行训练和识别。相似文献

17.

一种基于文本检测的书脊定位方法

崔晨任明武《计算机与数字工程》2020,48(1):178-182,251

书脊定位是实现图书管理自动化的重要技术,通过对定位分割出的书脊图像进行图像匹配或文本识别获得图书信息,可大大减小图书检索、整理的人力劳动。论文提出了一种基于文本检测的书脊区域粗选方法,首先通过序贯分割算法检测图像中的字符整体区域,然后根据字符宽度和距离将同属于一本书的字符加入相似字符集合,根据集合内的字符中心和字符宽度计算候选书脊区域,最后通过支持向量机分类器精选书脊区域。相比于已有的书脊定位方法,论文算法在光照敏感、相邻书脊颜色对比度敏感、书脊多角度倾斜检测等方面进行了改善,在实验中取得了较好的定位成功率。相似文献

18.

基于灰度差分的新闻视频标题字幕探测

陈树越张世林《计算机与数字工程》2010,38(11):145-147,151

为实现新闻视频图像中标注文本的快速检测与定位,提出了一种有效的字幕定位方法。该方法通过灰度差分统计对视频帧中文字区域进行行定位,再利用行定位信息得到的子图像在垂直方向的投影进行列定位,最后对预处理结果进行过滤和合并得到文字区域定位的精确结果。实验结果表明：该方法效果良好,不受文字大小影响,不受图像背景复杂度限制,方便快捷。相似文献

19.

一种用于动态场景的全景表示方法 总被引：3，自引：0，他引：3

杜威李华《计算机学报》2002,25(9):968-975

针对全景图无法表示动态场景这一问题，提出一种用于动态场景的全景图表示方法，将视频纹理和全景图结合起来，构造动态全景图。系统首先将一系列定点拍摄的图像拼接成全景图，然后用摄像机拍摄场景中周期或随机运动的物体，提取视频纹理，最后视频纹理与全景图对准并融合，生成动态全景图。动态全景图既保持静态全景图全视角漫游的优点，又使得场景具有动态的特征，极大地增强漫游的真实感。相似文献

20.

An ASIC implementation of Kohonen's map based colour image compression

《Real》2004,10(1):31-39

This paper presents a new hardware design for a neural network based colour image compression. The compressed image consists of a colour palette containing few best colours and the coded image. Kohonen's map neural network is applied to construct the colour palette and the coded image, both forming the compressed image. The Kohonen's map based compression results in linear time complexity (in the size of the image). It is advantageous over traditional JPEG in colour quantization applications and compression of images with limited colours. The architecture of the hardware unit is based on single instruction multiple data methodology. The architecture has been implemented in an application specific integrated circuit and results show that the proposed design achieves high speed allowing inputs at a video rate for compression of images up to size of 512×512 with low area requirement. 相似文献