共查询到20条相似文献,搜索用时 15 毫秒
1.
对象建议算法(object proposals)是对象检测中的常用算法,用于快速定位物体区域。根据自然场景文本的特点,将对象建议算法应用到文本检测中,并与经典的最稳定极值区域算法相结合;然后,通过贝叶斯模型融合了笔画宽度特征、视觉散度特征和边缘梯度特征,并将文本和非文本区域的区分问题转换成一个二值标记问题,通过最小化能量函数寻找最佳标记;最后,通过均值漂移聚类寻找文本区域的中心生成文本行。经实验证明,本算法在常用的自然场景文本检测数据集上速度得到了提高,并且一定程度上解决了传统最稳定极值区域算法对光照敏感的问题,获得了较高的查全率。 相似文献
2.
3.
针对在复杂的自然场景中中文本倾斜、模糊、光照等检测难题,提出一种基于卷积神经网络YOLOv3与最大极值稳定区域MSER的检测方法YOLOv3-M,并针对中文场景分别改善YOLOv3与MSER.通过YOLOv3算法对图像文本区域的矩形坐标进行回归预测,设计一个基于MSER的角度检测方法与之关联,实现倾斜文本行的检测.YO... 相似文献
4.
自然场景中的文本检测对于视频、图像和图片等海量信息的检索管理具有重要意义.针对自然场景中的文本检测面临着图像背景复杂、分辨率低和分布随意的问题,提出一种场景文本检测的方法.该方法将最大稳定极值区域算法与卷积深度置信网络进行结合,把从最大稳定极值区域中提取出来的候选文本区域输入到卷积深度置信网络中进行特征提取,由Softmax分类器对提取的特征进行分类.该方法在ICDAR数据集和SVT数据集上进行实验,实验结果表明该方法有助于提高场景文本检测的精确率及召回率. 相似文献
5.
针对图像处理(如OCR技术)对图像方向要求十分严格,文本图像方向具有不确定性的问题,提出了中文文本图像倒置快速检测算法.利用投影技术定位出文本字符,结合中文字符及标点符号结构特征,筛选出文本图像中的标点符号,根据标点符号像素分布特点判断出类型,结合标点符号的使用习惯,采用统计的方法判断中文文本图像是否倒置.实验结果表明,投影方法可以不用基于内容达到高效快速的要求,利用统计方法可以保证判别率,该方法可用于OCR预处理过程. 相似文献
6.
7.
8.
顾恭 《计算机应用与软件》2021,38(8):206-213,279
车牌定位是车辆信息识别中的关键和基础.为解决在复杂无约束场景下存在的车牌定位精度不高,噪点和干扰因素较强等问题,提出一种基于最大稳定极值区域和卷积神经网络的车牌精准定位新方法.利用最大稳定极值区域找出车辆图像中二值化参数较为稳定的子图像区域;根据车牌的先验知识,滤掉明显不符合车牌字符特征的子图像区域;对保留下的子图像进... 相似文献
9.
首先阐述了文本定位的基本流程,然后列举了现有的主要文本定位方法,分析了基于区域、纹理、边缘、角点的文本定位方法和机器学习的文本定位方法的优缺点,详细说明了文本区域验证和文本块区域合并的方法,最后总结了各种文本定位方法。 相似文献
10.
首先阐述了文本定位的基本流程,然后列举了现有的主要文本定位方法,分析了基于区域、纹理、边缘、角点的文本定位方法和机器学习的文本定位方法的优缺点,详细说明了文本区域验证和文本块区域合并的方法,最后总结了各种文本定位方法。 相似文献
11.
12.
13.
目前在图像处理领域,自然场景下的文本定位算法是一项具有困难的挑战,EAST算法是近年来性能比较出色的自然场景文本定位算法之一,具有较高的召回率和识别率,但是仍存在感受野不够大,样本权重不合理的问题。因此对EAST算法进行改进,对EAST网络结构进行改进,加入ASPP网络,提高了感受野,对loss进行改进,优化了样本权重不合理的问题,提高了对文本的定位效果。实验结果表明,提出的算法在保持18 f/s的同时,在ICDAR 2015文本定位任务的召回率为78.43%,准确率为85.78%,F-score为81.94%,优于经典EAST算法。 相似文献
14.
15.
陈虹宇 《自动化与信息工程》2010,31(3):4-6,10
基于人脸类似椭圆的特性,提出一种基于图像矩的驾驶员面部椭圆拟合定位方法.该方法利用肤色信息对驾驶室采集的彩色图像在颜色空间进行快速分割的基础上,利用图像矩拟合驾驶员面部椭圆,从而准确的定位跟踪驾驶员的位置,有效的降低了驾驶室的复杂背景、驾驶员各种面部姿态、表情对人脸检测定位的影响,同时也避免了常用椭圆拟合方法计算量大的不足.实验与仿真表明该方法具有快速、稳健和姿态不敏感的特性. 相似文献
16.
智慧城市的首要任务是城市场景监控及其信息分析,场景图像中文本信息的识别是一种直观且高效的场景信息分析手段,但目前场景图像的中文文本提取由于图像光照和模糊、中文字符结构复杂等因素,未能达到很好的效果.为解决这一问题,提出一种边缘增强的最大稳定极值区域(maximally stable extremal regions, MSER)检测方法,可在光照和模糊影响的条件下提取MSER,通过几何特征约束条件高效地过滤明显的非MSER,得到高质量的候选MSER.之后使用提出的中心聚合方法对分割成多个MSER的候选中文文本域进行中文的聚合,使得候选区域成为单个候选的中文文本分量,再对这些分量进行分析,并运用机器学习选出正确的中文文本.实验结果表明:该算法能够更有效地提取出自然场景图像中的中文文本. 相似文献
17.
基于边界的最小二乘椭圆拟合改进算法 总被引:2,自引:0,他引:2
由于变电站巡检机器人停靠位置和云台转动的偏差,拍摄所获得的图像中仪表位置会有较大不同。为解决图像中仪表的定位问题,文中提出了一种快速地利用边界提取椭圆形目标的方法,可有效地解决图像中圆形目标的提取。原有最小二乘椭圆拟合算法对图像边界上所有样本点都参与运算,所以会对椭圆拟合的最后结果产生偏差且耗时较长。针对这种情况,采取边界的最小二乘拟合算法,依次取图像边缘提取后的边界,逐段拟合椭圆,并对拟合出的椭圆进行评估,选取适合待检测目标的椭圆区域,具有快速高效、定位准确等特点。最后,通过合成图像和实际图像的应用验证了算法能够拟合出具有高精度的椭圆,能够有效地处理仪表表盘的提取。 相似文献
18.
提出了一种基于Adaboost算法的场景中文文本定位的新方法。首先利用边缘特征进行文本区域的检测,即对数字图像进行边缘提取、二值化处理,然后通过连通域分析去除明显的非字符连通域,并获得候选的文本区域。对场景中文文本区域进行分析,提取了场景中文文本的4类特征,并利用这4类特征经过分类与回归决策树构造了Adaboost强分类器。将候选文本区域送入强分类器,得到正确的文本区域。实验结果表明方法不仅对场景文本图像中字体、大小和颜色多变的文本具有很好的定位效果,而且具有很高的召回率和准确率。 相似文献
19.
传统的椭圆拟合使用标准广义特征值(GEVD)分析算法.通过统计分析技术,可知该技术在拟合数字椭圆时,存在估计偏差大、均方误差大的缺点.其产生原因是数据噪声的有色性和自相关函数矩阵的条件数过大,因此对数据噪声的预白化滤波和对数据的正则化变换是提高椭圆拟合的有效措施.这从理论上有力支持了Hartley提出的正则化技术.根据分析,我们开发了一个简化GEVD技术.通过理论分析和计算机仿真实验,表明了它固有地同时具备噪声预白化功能和数据正则化功能,因此,它能给出均方误差相当小的无偏估计,由于它无须进行预白化变换或正则化变换,并把求解GEVD过程的维数从6降为2,所以它还具有计算快速、实现简单方便的优点. 相似文献
20.
针对传统的最大稳定极值区域(MSER)方法无法很好地提取低对比度图像文本区域的问题,提出一种新的基于边缘增强的场景文本检测方法。首先,通过方向梯度值(HOG)有效地改进MSER方法,增强MSER方法对低对比度图像的鲁棒性,并在色彩空间分别求取最大稳定极值区域;其次,利用贝叶斯模型进行分类,主要采用笔画宽度、边缘梯度方向、拐角点三个平移旋转不变性特征剔除非字符区域;最后,利用字符的几何特性将字符整合成文本行,在公共数据集国际分析与文档识别(ICDAR)2003和ICDAR 2013评估了算法性能。实验结果表明,基于色彩空间的边缘增强的MSER方法能够解决背景复杂和不能从对比度低的场景图像中正确提取文本区域的问题。基于贝叶斯模型的分类方法在小样本的情况下能够更好地筛选字符,实现较高的召回率。相比传统的MSER进行文本检测的方法,所提方法提高了系统的检测率和实时性。 相似文献