首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 484 毫秒
1.
智慧城市的首要任务是城市场景监控及其信息分析,场景图像中文本信息的识别是一种直观且高效的场景信息分析手段,但目前场景图像的中文文本提取由于图像光照和模糊、中文字符结构复杂等因素,未能达到很好的效果.为解决这一问题,提出一种边缘增强的最大稳定极值区域(maximally stable extremal regions, MSER)检测方法,可在光照和模糊影响的条件下提取MSER,通过几何特征约束条件高效地过滤明显的非MSER,得到高质量的候选MSER.之后使用提出的中心聚合方法对分割成多个MSER的候选中文文本域进行中文的聚合,使得候选区域成为单个候选的中文文本分量,再对这些分量进行分析,并运用机器学习选出正确的中文文本.实验结果表明:该算法能够更有效地提取出自然场景图像中的中文文本.  相似文献   

2.
为了准确有效地定位出图像中的维吾尔文本区域,提出了一种基于通道增强最大稳定极值区域(Maximally Stable Extremal Region,MSER)和卷积神经网络(Convolutional Neural Network,CNN)的图像文本区域定位方法。应用通道增强MSER提取候选区域,根据文本特征的启发式规则以及CNN分类结果去除非文本和重复区域,通过区域融合算法得到词级别文本区域,根据该区域的色彩相近程度和空间关系召回遗漏的文本区域,并通过CNN网络对召回的区域分类融合,定位出图像文本区域。实验结果表明,该方法可以准确有效地定位文本区域,具有鲁棒性和应用性。  相似文献   

3.
针对复杂场景下,由于文字背景复杂性而带来的文字定位不准确的问题,提出了一种Radon倾斜校正与MSER(最大稳定极值区域)结合的算法,基于该算法识别出文字在所处复杂背景中的位置。首先,对图像进行预处理,采用Canny算子对图像进行边缘检测,并利用Radon变换对倾斜图像进行校正。然后通过二进小波变换对图像进行增强处理,去除噪声。最后提取MSER,经过粗处理、细处理后,检测出文本所处位置。实验结果表明,基于Radon倾斜校正与MSER结合的方法,能够有效提高文本定位的准确率。  相似文献   

4.
针对传统的最大稳定极值区域(MSER)方法无法很好地提取低对比度图像文本区域的问题,提出一种新的基于边缘增强的场景文本检测方法。首先,通过方向梯度值(HOG)有效地改进MSER方法,增强MSER方法对低对比度图像的鲁棒性,并在色彩空间分别求取最大稳定极值区域;其次,利用贝叶斯模型进行分类,主要采用笔画宽度、边缘梯度方向、拐角点三个平移旋转不变性特征剔除非字符区域;最后,利用字符的几何特性将字符整合成文本行,在公共数据集国际分析与文档识别(ICDAR)2003和ICDAR 2013评估了算法性能。实验结果表明,基于色彩空间的边缘增强的MSER方法能够解决背景复杂和不能从对比度低的场景图像中正确提取文本区域的问题。基于贝叶斯模型的分类方法在小样本的情况下能够更好地筛选字符,实现较高的召回率。相比传统的MSER进行文本检测的方法,所提方法提高了系统的检测率和实时性。  相似文献   

5.
目的 目前,基于MSERs(maximally stable extremal regions)的文本检测方法是自然场景图像文本检测的主流方法。但是自然场景图像中部分文本的背景复杂多变,MSERs算法无法将其准确提取出来,降低了该类方法的鲁棒性。本文针对自然场景图像文本背景复杂多变的特点,将MSCRs(maximally stable color regions)算法用于自然场景文本检测,提出一种结合MSCRs与MSERs的自然场景文本检测方法。方法 首先采用MSCRs算法与MSERs算法提取候选字符区域;然后利用候选字符区域的纹理特征训练随机森林字符分类器,对候选字符区域进行分类,从而得到字符区域;最后,依据字符区域的彩色一致性和几何邻接关系对字符进行合并,得到最终文本检测结果。结果 本文方法在ICDAR 2013上的召回率、准确率和F值分别为71.9%、84.1%和77.5%,相对于其他方法的召回率和F值均有所提高。结论 本文方法对自然场景图像文本检测具有较强的鲁棒性,实验结果验证了本文方法的有效性。  相似文献   

6.
根据对自然场景图像分割后具有标志牌和背景明显分开等特点,提出了一种基于边框删除的标志牌文本提取算法,首先在二值化图像中采用基于边缘检测和投影算法对标志牌区域进行定位,然后采用边框删除算法提取标志牌文本.大量实验结果表明该方法能够准确定位并提取非规则的标志牌文本.  相似文献   

7.
基于聚类与边缘检测的自然场景文本提取方法   总被引:1,自引:0,他引:1  
为了解决复杂自然场景、光照不均匀及背景纹理丰富图像中文本的有效提取,提出一种基于K-means聚类与边缘检测结合的自然场景文本提取方法.该方法通过改进K-means聚类算法,实现文本区域的分割;然后对分割后的图像进行二值子图分解,将分解后的各子图像的连通区域进行标记与分析,得到候选的字符区域;最后利用文本区域的边缘特征对候选字符区域过滤,实现文本字符的提取.实验结果表明,该方法能有效提取出复杂背景、光照影响及背景纹理丰富图像中的文本字符区域.  相似文献   

8.
巡检机器人中指针式仪表示数的自动识别方法   总被引:1,自引:0,他引:1  
孙婷  马磊 《计算机应用》2019,39(1):287-291
针对巡检机器人室外自主识别仪表示数易受到光照影响的问题,在研究了基于二维伽马函数的仪表图像光照不均匀自适应校正算法的基础上,提出了基于最大稳定极值区域(MSER)提取指针区域的算法。首先,通过三尺度高斯函数提取光照分量,构造二维伽马函数自动地调整图像反光区域或过暗区域的亮度;然后,通过MSER的两次稳定区域检测提取指针区域;接着,以指针通过仪表轴心为条件,用细化算法和累计概率霍夫变换(PPHT)精确地定位到指针,提高了定位直线的准确度;最后,通过PPHT检测的直线两个端点与轴心位置比较,直接可以判断指针指向,更加方便了计算示数。实验结果表明,所提的仪表示数识别方法能够适应不同光照下、不同类型仪表的指针定位,且识别示数的正确率达到94%以上。  相似文献   

9.
用于行人头部特征提取的目标区域匹配方法   总被引:1,自引:1,他引:0       下载免费PDF全文
为了准确地定位与跟踪序列图像中的运动行人以获取精确的客流量信息,提出了一种基于目标区域匹配的行人头部特征提取新方法。与常用的基于致密视差图的头部区域视差获取方法不同,该方法基于“先分割后匹配”的思想,即首先借助单目图像处理方法对基准图进行分割,获取候选头部区域;然后直接将这些候选头部区域作为目标区域,在匹配图中搜索其匹配对应区域以获取候选头部区域的视差;再借助候选头部区域的视差提取出候选头部区域的深度与透视特征,用于去除虚假头部区域以获取最终的头部检测结果。性能测试与实验结果表明,该方法不仅视差提取精度高、实时性好,并且借助该方法获取的头部特征具有较高的区分度,可以有效去除候选头部区域中的虚假头部区域,使客流量检测的准确率达到90%以上。  相似文献   

10.
殷航  张智  王耀林 《计算机应用与软件》2021,38(10):168-172,195
针对在复杂的自然场景中中文本倾斜、模糊、光照等检测难题,提出一种基于卷积神经网络YOLOv3与最大极值稳定区域MSER的检测方法YOLOv3-M,并针对中文场景分别改善YOLOv3与MSER.通过YOLOv3算法对图像文本区域的矩形坐标进行回归预测,设计一个基于MSER的角度检测方法与之关联,实现倾斜文本行的检测.YOLOv3-M弥补了YOLOv3不能检测倾斜目标的缺点以及MSER检测容易被复杂场景干扰的缺点,并且YOLOv3与MSER都在检测速度上有着优秀的表现.实验结果表明,YOLOv3-M算法准确率达到81.2%,召回率达到69.7%,其检测速度达到45帧/s.  相似文献   

11.
对复杂自然背景下的图像文字检测技术进行了研究,提出了一种基于双门限梯度模式的图像文字检测方法。首先,在文字粗检测阶段中,该方法抽取了最大极值稳定区域(Maximally Stable Extremal Regions,MSER)作为候选文字区域,避免了对整幅图像进行扫描,极大地提高了检测速度和实时性;其次,在文字精检测阶段的特征提取部分,为了克服文字区域颜色对比反转问题和自然图像 的噪声干扰问题,提出了一种双门限梯度模式特征来描述文字区域的纹理特征;最后,在文字精检测的检测器设计中,利用极限学习机构造新的级联型ELM(Extreme Learning Machine)检测器,极大地缩短了分类器的训练时间。实验结果表明,该方法不仅具有优良的检测性能,而且能极大地缩短分类器训练时间和检测时间。  相似文献   

12.
唐乐  路林吉 《微型电脑应用》2012,28(3):61-64,69
针对传统图形匹配算法对稳定特征提取不充分的缺点,提出了一种基于MSER与SURF的图形匹配新方法。MSER与SURF是两种特征提取算法,各有优缺点,且具有互补的特性。提出的算法分别用MSER与SURF检测图像的特征点,用SURF描述子表征检测到的所有特征点,从而实现了两者的互补,并获取了更为丰富的特征描述。基于更丰富的特征,描述信息,进行特征匹配,最后得到的图像匹配效果,相比传统方法更加稳定。  相似文献   

13.
基于DFT和水印分割的遥感影像数字水印方案   总被引:1,自引:0,他引:1  
提出一种基于DFT和水印分割的遥感影像数字水印方案.算法首先对宿主遥感影像进行归一化处理,以确定不变质心,并根据不变质心选取方形区域作为水印嵌入区域;然后,产生一个伪随机序列作为数字水印信息,并将其分成两部分;最后对宿主遥感影像中所选区域进行DFT变换,并将水印分别嵌入DFT变换的幅值和相位成分中.实验证明本文算法对J...  相似文献   

14.
针对光照不均和背景复杂度所导致的自然场景文本检测中文本的漏检和错检现象,提出一种基于笔画角度变换和宽度特征的自然场景文本检测方法。分析发现与非文本相比,文本具有较稳定的笔画角度变换次数和笔画宽度,针对这两个特性提出笔画外边界优劣角变换次数和增强笔画支持像素面积比两种特征。前者分段统计笔画外轮廓角度变换次数;后者计算笔画宽度稳定区域在笔画总面积的占比,用来分别反映笔画角度和宽度变化稳定特性。为降低文本漏检率,采用多通道最大稳定极值区域(maximally stable extremal regions,MSER)检测,合并所有候选区域,提取候选区域的笔画特征和纹理特征,利用支持向量机完成文本和非文本区域分类。在ICDAR2015数据库上,算法的精确率和召回率分别达到79.3%和72.8%,并在一定程度上解决了光照不均和复杂背景的问题。  相似文献   

15.
刘会平  国伟 《计算机应用》2014,34(9):2645-2649
针对现代网络环境通信的隐秘性和信息容量问题,提出了一种基于数字加网的信息隐藏算法,通过该算法将秘密信息嵌入文本载体中实现隐秘通信。该算法首先将隐秘信息隐藏在由网点组成的背景底纹图案中,接着与随机生成的半色调调频网点图像相融合,最后将嵌入水印后的背景底纹图案作为常规元素叠加到文本文档的版面中。分析与实验结果表明,该方法可以隐藏的隐秘信息容量大,在A4幅面的文档页面中嵌入72000个汉字的信息量,而且视觉效果美观自然,隐蔽性好,安全性高,文件体积小,可以广泛应用于现代网络安全通信领域。  相似文献   

16.
本文提出一种用于区域表达的数据结构——数字搜索树(DST)及其线性化编码(LDST)。给出了在正方形区域图象最坏情况下的数据压缩公式,公式表明在图象分辨率较高时用LDST可使数据得到有效的压缩。最后,本文还给出了LDST与线性四叉树之间的转换算法及时间复杂度分析。  相似文献   

17.
多尺度最稳定极限区域仿射不变特征   总被引:1,自引:0,他引:1  
基于局部区域的仿射不变特征被广泛应用于目标识别、场景分类和图像检索.在已经提出的仿射不变局部特征中,最稳定极限区域特征MSER(maximally stable extremal region)在多个方面具有优越的性能.但是由于最稳定极限区域特征MSER是从单一尺度图像中提取的,当图像尺度发生较大变化时,图像的模糊会使最稳定极限区域特征的边界发生变化,从而影响特征的稳定性.针对这一问题,通过定义多尺度空间中极限区域的稳定性指标,提出一种在图像空间和尺度空间都最稳定的极限区域特征,并设计了在尺度空间进行极限区域提取的快速算法.同时,针对极限区域可以较好地描述特征轮廓的特点,将局部灰度梯度信息和形状信息相结合设计了一种新的特征描述器.这种特征被称为多尺度最稳定极限区域MMSER(multi-scale maximally stable extremal region)特征.实验结果表明,在不同仿射变化条件下,MMSER的稳定性和可识别性均优于MSER,而且其描述器的创建时间约为SIFT描述器的45%.  相似文献   

18.
针对数字PCR系统的配套软件缺少多重实验液滴分类功能的不足,提出了一种网格区域化DBSCAN聚类算法.首先对数据进行网格映射,建立网格索引;然后计算网格间权值并进行深度搜索扩张;最后将网格空间的聚类结果映射回数据空间.人工数据集的仿真实验表明,所提算法能够有效识别簇边缘区域且具有优良的运行效率.在此基础上,提出了基于网格区域化DBSCAN聚类的数字PCR液滴分类方法,经由对比实验及有效性测试,结果表明所提方法能够便捷、准确地进行液滴分类.可见所提方法适用于数字PCR液滴分类.  相似文献   

19.
Geometric distortions are simple and effective attacks rendering many watermarking methods useless. They make detection and extraction of the embedded watermark difficult or even impossible by destroying the synchronization between the watermark reader and the embedded watermark. In this paper, we propose a blind content-based image watermarking scheme against geometric distortions. Firstly, the MSER detector is adopted to extract a set of maximally stable extremal regions which are affine covariant and robust to geometric distortions and common signal processing. Secondly, every original MSER is fitted into an elliptical region that was proved to be affine invariant. In order to achieve rotation invariance, an image normalization process is performed to transform the elliptical regions into circular ones. Finally, watermarks are repeatedly embedded into every circular disk by modifying the wavelet transform coefficients. Experimental results on standard benchmark demonstrate that the proposed scheme is robust to geometric distortions as well as common signal processing.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号