首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
视频数据中的文本是视频语义理解和检索的重要信息来源.文中对视频中文本的检测、定位、提取、增强和识别进行了研究.提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止和滚动中英文文字进行提取,最后对文本区域进行二值化.实验表明文中方法取得了良好的效果.  相似文献   

2.
本文提出了一种基于Laplace变换的视频图像水平文本检测算法.首先用Laplace变换对图像滤波,并根据梯度信息用K-均值方法对像素点聚类,得到候选文本区;然后用投影算法对候选文本区进行边缘精确,得到候选文本块;最后分析候选文本块的几何特性,进行文本验证.本文算法在公共数据库上的测试结果表明了算法的可行性和有效性.  相似文献   

3.
李念永 《光电子.激光》2009,(11):1544-1547
针对复杂彩色图像中文本的特征,提出了利用一组级联弱分类器甄别文本区域的算法。首先根据文本块的边缘特征遴选出备选图像块,而后将其送入设计好的级联弱分类器,依次利用文本块特征、颜色信息、区域特征和字符笔画特征准则判断备选图像块是否包含文本。采用专用的文本定位比赛用图进行实验的结果表明,该方法运算简单,定位时间短,定位准确率可达到94.1%,召回率为85.9%。  相似文献   

4.
基于多数据融合的快速人脸检测与特征定位算法   总被引:1,自引:0,他引:1  
针对彩色图像提出了基于肤色和特征验证的人脸检测算法,由肤色分割、排除假区域、特征验证3部分组成。在肤色分割部分,提出自适应阈值法,再通过几何特征排除一些假区域,运用边缘检测、模板匹配和投影法精确定位眼睛和嘴巴,从而验证确认人脸,最后通过投影法定位出鼻子。实验证明该算法检测速度快、准确率高,具有较好的鲁棒性。  相似文献   

5.
张鑫姝  郭戈  程娟 《电子技术》2010,47(4):22-24
本文提出一种视频文本语义信息分析的新思路,即在文本区域提取后结合文种识别理论来提取新闻视频的来源和身份等高级语义信息,同时文种识别结果可为OCR的选择提供先验知识。主要工作包括:1)针对视频中的字幕,提出一种基于时-空分析的算法来检测视频中的字幕,然后对检测到的字幕通过投影分析进行定位、增强和二值化;2)对提取到的文本区域提出一种基于PCA和小波变换的文种识别算法。  相似文献   

6.
李翌昕  马尽文 《信号处理》2017,33(4):558-571
对自然场景中的文字进行识别和理解是大量计算机视觉应用的基础。文本检测算法旨在识别出自然图像中的文字信息,目前已经成为计算机视觉和智能信息处理领域研究的一个热点。本文首先对文本检测算法的目标、技术路线及其所面对的挑战进行了分析与介绍。然后回顾了几种经典的文本检测算法,并介绍了两种代表最新研究趋势的深度学习型文本检测算法。进一步,本文阐述了几个主流的文本检测数据集并总结了一些代表性文本检测算法在这些数据集上的检测结果。最后,本文讨论了文本检测的研究现状、面临的挑战和发展的趋势。   相似文献   

7.
为实现对机载雷达视频的识别,正确评估飞行员的机载雷达操纵水平,提出了一种基于连接文本提议网络(CTPN)与Tesseract相结合的对机载雷达视频中关键字符进行识别的方法。通过视频压缩、图像截取、图像拼接、腐蚀与膨胀等操作,对机载雷达视频进行预处理,接着将视频转化为图像。通过CTPN对图像进行文本检测,最后调用Tesseract对检测出的字符进行识别,形成文本输出,实现对机载雷达视频的自动化识别,从而替代现有的人工判读方式,达到提升机载雷达视频分析效率的目的,为借助视频分析快速准确评估飞行员的雷达操纵水平提供依据。  相似文献   

8.
一种基于变异灰度直方图的视频字幕检测定位方法   总被引:9,自引:1,他引:8  
为实现视频图像中字幕的快速检测与定位,本文提出一种变异灰度直方图VGH.文章给出VGH的定义,对其中的特征及其与图像中字幕的映射关系作了分析,并在此基础上给出视频字幕的检测与定位方法.该方法将垂直子图像转换为基于行的VGH (VGHR),将水平子图像转换为基于列的VGH (VGHC),通过对其中的凹谷特征和梳状凸台特征的识别,实现对字幕的检测与定位.文章最后给出某些实验结果,表明了算法的有效性.  相似文献   

9.
基于肤色检测的快速五官定位算法   总被引:3,自引:1,他引:2  
根据视频应用的特点,结合人脸的肤色和特征部位几何分布特征,提出了一种应用于视频序列人脸部位的五官定位算法。实验表明,该算法定位速度快,误检率低。  相似文献   

10.
于雷  夏鹏 《电视技术》2012,36(Z2):24-25,59
介绍了通过高级语义技术以及自然语言处理技术对专利进行文本挖掘分析的方法,同时利用该方法对涉及视频编解码领域的专利进行分析,得到一些有用的建议。  相似文献   

11.
针对周期性纹理背景影响织物缺陷检测效果的问题,提出了一种基于粗糙度测量和颜色距离的织物缺陷检测方法。该方法先将待检测图像由RGB颜色空间转换到HSV颜色空间,并分别对三通道进行同态滤波处理,以提升缺陷与背景之间的对比度;利用粗糙度测量对织物图像进行分类,并将同一类别的织物图像分成大小相同且互不重叠的图像分块,分别估计各个图像分块与其八邻域图像分块的颜色距离,从而实现对缺陷的粗定位;最后对粗定位图像分块进行显著性和二值化处理,有效减少了周期性纹理背景对检测结果的影响。实验结果表明:与近期4种方法相比,本文方法对周期性纹理织物图像表现出了较好的检测效果,检测准确率更高。  相似文献   

12.
本文提出了一种基于小波分析和区域连通性分析的视频文字定位方法。首先从视频流中获取视频帧,并对其进行灰度化等预处理,其次对预处理后的图像进行db小波变换,获取其水平和垂直的高频分量HH,然后对高频分量进行Log边缘检测和形态学操作,初步筛选候选文字区域,再然后利用区域连通性的判别方法,精确定位文字区域,最后输出文本区域并标注。  相似文献   

13.
提出了一种基于边缘的视频文字检测算法.利用Canny算子对图像进行边缘检测,然后根据文字边缘线条的特征,过滤非字符的边缘线条.最后利用文字线条区域的相似性,设置综合阈值,得到最终的文字区域.实验结果表明该算法不仅对规则排列的文字有较高的查全率.对不规则排列及扭曲的文字也能够准确定位.并对光照、阴影等条件不敏感.  相似文献   

14.
一种用于网络动画过滤的文字提取方法   总被引:1,自引:1,他引:1  
网络动画中往往包含丰富的字符信息,如果能够将这些字符信息加以提取和识别,将对网络动画的有效过滤具有重要意义。论文介绍了一种新的基于类边缘文本提取算法及其实现,该算法利用DCT方法提取出字符的类边缘信息,然后采用基于映射方法进行定位。实验结果表明,该方法能够准确、有效地定位和提取网络动画中的文字区域。  相似文献   

15.
图像中的文本包含了重要的语义信息。提出了一种基于连通区域分析的彩色图像文本自动定位算法。首先对彩色图像进行多通道分解,得到少量代表颜色下的二值图像。对二值图像进行连通区域标记,并计算连通区域的属性参数。然后根据关于连通区域属性的先验知识限制,去掉连通区域中的非文本区域,其他的作为候选文本区域。最后根据文本行的排列规律从候选文本区域中提取文本行。实验结果表明该方法能较快地定位文本区域,定位精度较高。  相似文献   

16.
针对传统火灾检测技术在面对大空间结构建筑及复杂环境中的不足,提出一种基于视频图像检测早期火灾的算法。该算法首先对视频图像进行阈值分割,然后根据火焰的颜色特征获取其中的疑似火焰区域。在此基础上计算疑似火焰区域的圆形度,并将圆形度与其整体特性相结合进行火灾的早期探测和预报。  相似文献   

17.
自然场景文本检测是图像内容分析和理解的重要前提.本文提出一种基于自适应色彩聚类和上下文信息分析的方法,用于检测自然场景图像文本.首先,将层次聚类和参数自学习策略结合,设计一种自适应色彩聚类方法,提取图像中的候选字符.该自适应色彩聚类方法能针对不同图像自动学习权重阈值,有较好的字符召回率.然后,利用文本中字符成行出现的性质,设计一种基于上下文信息的字符验证策略,既能保证较高字符召回率,也能有效移除非文本字符.最后,合并字符构建文本行,并通过后处理得到文本检测结果.在ICDAR2013公共数据集上的实验结果表明:本文分别获得74.17%的召回率,83.40%的准确率和78.52%的F得分.与其他文本检测方法相比,本文获得了较好的文本检测性能,说明本文方法的优越性.  相似文献   

18.
一般常用的边缘检测算法计算量较大,对细小边缘检测效果较差,不适合实时边缘检测系统。针对这一问题,本文提出一种连续分割的快速边缘检测算法:从相互垂直两方向分割梯度图像,提取截面曲线极大值获得图像边缘,使用形态学梯度,检测出细小的图像边缘。实验结果表明此算法较Canny等经典算法减少了计算量,提高了边缘检测精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号