首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
研究了图像定位的问题,由于存在污渍干扰等影响图像定位,针对以往单一特征进行图像文字定位及识别的系统中容易受到各种环境因素干扰的缺陷,提出了一种利用轴对称窗口进行边缘检测的图像文字检测算法。首先将利用轴对称滑动窗口提取水平和竖直方向上的边缘特征,利用连通域确定初始的图像文字位置;通过对可能的图像文字区域进行颜色色调验证,区域内垂直方向直方图投影,从而确定最终的图像文字位置。由于利用多种特征综合检测图像文字进行仿真。仿真结果表明改进方法能准确检测出复杂场景下图像文字所在区域。  相似文献   

2.
传统的自然场景文字检测方法所采用的手工设计特征在应对复杂自然场景时缺乏鲁棒性。针对复杂自然场景中的多方向文字检测问题,提出了一种新的基于深度学习文字检测方法,采用全卷积网络(Fully Convolutional Networks,FCN)并融合多尺度文字特征图,结合语义分割的方法分割文字候选区域,利用分割得到的文字候选区域直接获取文字候选检测框并进行扩大补偿处理,对文字候选检测框进行后处理得到最终检测结果。该方法在ICDAR2013、ICDAR2015标准数据集进行了测评,实验结果表明该方法相比一些最新方法取得了更好的性能。  相似文献   

3.
针对室内场景深度图像,检测场景中的面片边缘信息并确定场景中的完整面信息是实现室内场景分析和理解的基础.基于深度信息局部二值模式特征,提出一种室内场景深度图像边缘检测的方法.首先对场景深度信息图分别求X方向和Y方向的梯度信息,结合2个梯度图找到深度信息图的基本边缘信息;然后计算基本边缘附近的局部二值模式特征信息,并计算深度图每个点的法线信息;最后利用深度信息局部二值模式特征和法线信息对边缘信息进行判断和矫正,以提取深度图像的面片边缘信息.实验结果表明,该方法能够高效、准确地检测室内场景深度图像的边缘信息,避免边缘信息的过检测和欠检测.  相似文献   

4.
针对室内场景深度图像,检测场景中的面片边缘信息并确定场景中的完整面信息是实现室内场景分析和理解的基础.基于深度信息局部二值模式特征,提出一种室内场景深度图像边缘检测的方法.首先对场景深度信息图分别求X方向和Y方向的梯度信息,结合2个梯度图找到深度信息图的基本边缘信息;然后计算基本边缘附近的局部二值模式特征信息,并计算深度图每个点的法线信息;最后利用深度信息局部二值模式特征和法线信息对边缘信息进行判断和矫正,以提取深度图像的面片边缘信息.实验结果表明,该方法能够高效、准确地检测室内场景深度图像的边缘信息,避免边缘信息的过检测和欠检测.  相似文献   

5.
针对自然场景中复杂背景干扰检测的问题,本文提出一种基于视觉感知机制的场景文字检测定位方法。人类视觉感知机制通常分为快速并行预注意步骤与慢速串行注意步骤。本文方法基于人类感知机制提出一种场景文字检测定位方法,该方法首先通过两种视觉显著性方法进行预注意步骤,然后利用笔画特征以及文字相互关系实现注意步骤。本文方法在ICDAR 2013与场景汉字数据集中均取得较有竞争力的结果,实验表明可以较好地用于复杂背景的自然场景英文和汉字的检测。  相似文献   

6.
基于蚁群优化算法的复杂背景图像文字检测方法   总被引:2,自引:0,他引:2  
李敏花  柏猛 《计算机应用》2011,31(7):1844-1846
针对复杂背景图像中的文字检测问题,提出一种基于蚁群优化算法的复杂背景图像文字检测方法。该方法首先采用蚁群优化算法提取图像边缘;然后在边缘图像上提取特征,采取由粗到精多级检测、验证的策略进行文字检测。与基于Soble算子、Canny算子等方法的对比实验结果表明,所提出的基于蚁群优化算法的文字检测方法可有效地实现复杂背景图像中的文字检测。  相似文献   

7.
基于ViBE目标检测算法,融合交通监控视频中车辆的边缘与颜色特征,提出一种基于多特征融合的算法,实现对复杂交通场景中车辆阴影的检测与去除。通过ViBE提取前景目标,采用串行融合方式检测阴影。首先在传统的基于边缘特征检测阴影的基础上,利用水平集方法代替水平垂直填充,实现多个前景目标内部边缘的快速填充。在获取候选的阴影区域后,结合HSV颜色特征以及形态学处理等操作,以达到更好的阴影去除效果。通过对不同的视频图像序列进行测试,表明提出的多特征融合算法能有效去除投射阴影,且优于单个特征方法,适用于复杂的交通场景。  相似文献   

8.
场景文字包含了重要的场景图像的语义信息。因此将场景图像中出现的文字抽取出来,将会对场景图像的内容分析、检索和浏览提供有益的帮助。提出的场景文字提取方法,是在边缘检测的基础上,使用分层块过滤的方法在不同尺度上过滤背景,产生场景文字区域,然后对聚合出来的文字区域根据笔划颜色和笔划宽度方面的特征进行二值化分割得到二值化文字图像,这些二值化后的文字区域图像可以作为OCR引擎的输入进行识别,从而达到提取场景图像语义信息的目的。分层块过滤的方法能较好地过滤背景聚合产生文字区域,利用文字的笔划特征也能有效地分割出文字笔划像素。实验结果也证明了方法的有效性。  相似文献   

9.
多特征融合的车辆阴影消除   总被引:2,自引:1,他引:1       下载免费PDF全文
目的 提出一种基于颜色特征和边缘特征相融合的算法,实现对复杂交通场景中车辆阴影的检测和消除。方法 首先,通过经典混合高斯背景建模方法建立背景模型,以帧差法获取运动目标前景。其次,针对复杂多变的交通道路场景,采用串行融合策略检测车辆阴影。对运动目标前景基于边缘特征检测阴影之后,再进行RGB颜色特征方法检测阴影,此过程中利用边缘差分、形态学处理等运算以达到更好的阴影消除效果。为提高算法效率,对前景区域进行阴影评估,从而判断是否有必要进行阴影检测和消除。结果 通过与统计参数法SP、统计非参数法SNP、两类判定性非模型法DNM1、DNM2等算法的对比,本文算法的阴影检测率和阴影识别率分别有大约10%的提升。实验结果表明,该算法能够有效消除车辆阴影,具有良好的准确性和鲁棒性。结论 本文算法结合颜色和边缘两种特征,弥补基于单个特征方法的单一性,降低由于阴影区域边缘复杂、车辆颜色与阴影颜色相近等原因造成的阴影误检率,阴影消除效果良好。  相似文献   

10.
王锴  曾祥进  黎新  张锐  徐成 《工矿自动化》2023,(3):23-30+52
基于机器视觉的输送带跑偏检测方法检测的输送带边缘特征中包含伪边缘,现有研究难以识别伪边缘,且多场景适应性差。针对该问题,对输送带监控图像提取感兴趣区域(ROI)并进行归一化,采用较大阈值区间的Canny算法提取边缘特征点,以提高算法的场景适应性,并采用形态学滤波方法处理部分杂质及伪边缘;对于Canny算法无法检测到有效边缘的图像,对提取的ROI进行伽马变换和45,135°方向的梯度滤波,以增强边缘特征,之后进行基于Canny算法的特征点提取和形态学滤波。以边缘点像素值关系、邻域特征、紧密性特征,以及边缘线长度、相对位置、斜率等作为约束条件,采用基于分治搜索思想的直线筛选排序算法对提取的边缘特征点进行筛选及拟合,得到输送带实时边缘。将实时边缘的像素值与未发生跑偏时边缘像素值做差,得到当前跑偏的像素值。试验结果表明,针对多种场景下的输送带监控图像,基于Canny算法和直线筛选排序的输送带跑偏检测方法检测误差小于3个像素值,百张图像检测时间为6.945 1 s,边缘计算机处理4路视频图像的CPU占有率为132%,满足现场输送带边缘检测的准确性、实时性要求。  相似文献   

11.
场景文本检测与识别对于自然场景的理解、图像中物体信息的获取以及自动驾驶与导航等研究有非常重要的作用.其中文本字符提取属于场景文本检测与识别的一个分支.在自然场景中,针对当前场景文本图像的不均匀照明等问题,提出一种基于边缘检测和改进的全局自适应文本提取模型结合的文本检测提取方法.首先,对输入的图像先做灰度处理和边缘检测,...  相似文献   

12.
针对复杂场景下,由于文字背景复杂性而带来的文字定位不准确的问题,提出了一种Radon倾斜校正与MSER(最大稳定极值区域)结合的算法,基于该算法识别出文字在所处复杂背景中的位置。首先,对图像进行预处理,采用Canny算子对图像进行边缘检测,并利用Radon变换对倾斜图像进行校正。然后通过二进小波变换对图像进行增强处理,去除噪声。最后提取MSER,经过粗处理、细处理后,检测出文本所处位置。实验结果表明,基于Radon倾斜校正与MSER结合的方法,能够有效提高文本定位的准确率。  相似文献   

13.
王梦迪  张友梅  常发亮 《计算机科学》2017,44(9):300-303, 314
文本定位作为文本识别的基础和前提,对图像深层信息的理解至关重要。针对自然场景下的文本定位受光照、复杂背景等因素影响较大的问题,提出了一种基于多方向边缘检测和自适应特征融合的自然场景文本定位方法。该方法首先将自然场景图像进行三通道八方向的边缘检测;然后 通过启发式规则 对得到的边缘图像进行过滤从而提取出备选文本域,进而对备选文本域进行自适应权值的HOG-LBP特征提取与融合;最后采用支持向量机进行特征分类学习,实现文本定位。实验结果表明,该方法能准确定位自然场景图片的文本区域,对光照和复杂背景具有较强的鲁棒性。  相似文献   

14.
改进的AdaBoost分类器在视频中的体育场景检测   总被引:9,自引:0,他引:9  
金鸣  邱锡鹏  吴立德 《计算机工程》2006,32(12):229-231
提出了一种使用改进的AdaBoost分类器来检测体育场景的方法。将电视新闻中的体育场景分为三类:草地运动,冰雪运动和人造场地运动。针对这几种不同的体育场景,提取颜色直方图、边缘方向直方图和共生矩阵纹理等3种低层视觉特征,然后用改进的可自动选择特征的boosting方法为每一类体育场景分别建立AdaBoost分类器。该文提出的方法应用在国际视频处理评测TRECVID2003中的“体育场景”语义特征抽取任务上,取得了很好的效果。  相似文献   

15.
嵌入在图像中的文字信息是图像语义的一种重要表达方式,通常反映了图像的主要内容,因此,准确检测出图像中的文字区域是正确理解图像内容的关键。本文提出一种边缘纹理特征与灰度特征相结合的文字区域检测算法。实验证明该算法效果较好。  相似文献   

16.
提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。  相似文献   

17.
俸亚特  文益民 《计算机应用》2021,41(12):3551-3557
针对越南场景文字检测训练数据缺乏及越南文字声调符号检测不全的问题,在改进的实例分割网络Mask R-CNN的基础上,提出一种针对越南场景文字的检测算法。为了准确地分割带声调符号的越南场景文字,该算法仅使用P2特征层来分割文字区域,并将文字区域的掩码矩阵大小从14×14调整为14×28以更好地适应文字区域。针对用常规非极大值抑制(NMS)算法不能剔除重复文字检测框的问题,设计了一个针对文字区域的文本区域过滤模块并添加在检测模块之后,以有效地剔除冗余检测框。使用模型联合训练的方法训练网络,训练过程包含两部分:第一部分为特征金字塔网络(FPN)和区域生成网络(RPN)的训练,训练使用的数据集为大规模公开的拉丁文字数据,目的是增强模型在不同场景下提取文字的泛化能力;第二部分为候选框坐标回归模块和区域分割模块的训练,此部分模型参数使用像素级标注的越南场景文字数据进行训练,使模型能对包括声调符号的越南文字区域进行分割。大量交叉验证实验和对比实验结果表明,与Mask R-CNN相比,所提算法在不同的交并比(IoU)阈值下都具有更好的准确率与召回率。  相似文献   

18.
针对袋装粮数量智能测算的要求,以实际场景视频图为分析对象,在对典型边缘检测算法实验结果分析的基础上,采用双阈值Canny边缘检测算子和形态学处理的方法提取粮袋特征轮廓——反光带的边界。提出基于众数理论和方差分析相结合的计数算法进行数量的二次判断,提高了计数算法的识别精度和测算效率。实验表明,该方法能准确地提取出粮袋的特征轮廓并进行计数,为粮食数量检测提供了一种有效方法。  相似文献   

19.
针对车辆行驶环境变化引起的视频场中运动目标大动态尺度变化、抖动、多场景下多目标检测分割等问题,提出一种基于视频的动态特征及边缘信息融合的运动车辆目标检测分割方法。利用特征提取所获视频场中光流场尺度信息与多方向边缘信息,通过逻辑"与"的二值信息融合技术对关联运动特征进行强化;设计自适应阈值三帧间差法预处理技术提取有效运动目标区域,提高算法检测速度,增强抗光照干扰能力。在多种场景下的实验结果表明,该方法有良好的检测性能指标,综合指标FM和检测速度分别达到90%和45帧/s。  相似文献   

20.
提出一种综合运用文字边缘特征、颜色信息以及视频时空特性的字幕提取方法。通过边缘检测获取字幕位置进而得到文字颜色,采用全局混合高斯模型对颜色建模,建模完成后直接利用模型从视频文字变化帧中提取文字颜色层。在判断字幕是否变化时,提出了“与”掩码图的方法。实验结果表明,对于复杂背景下包含1~2种颜色字幕颜色的视频,该方法具有良好的提取效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号