首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
研究图像二值化分割问题。针对模糊或者蜕化文档图像背景与文字融合在一起导致难以区分的难点,提出一种快速有效的两级结构图像分割算法。首先利用迭代算法对图像进行单一阈值分割,在每次迭代过程中以图像均值为依据,对图像进行均衡化处理;在基于全局分割的基础上,在局部范围内根据噪声的统计特性对文档图像进行去噪处理。方法简单高效,实验结果显示该方法能快速地将文档中的文字与背景进行分离,为后续的文档自动化处理提供准确有效的二值化图像。利用该方法,可以方便地拓展到其他类型的二值化处理系统中,例如车牌分割等。  相似文献   

2.
一种基于模糊聚类的快速二值化方法   总被引:5,自引:0,他引:5  
通过确定阈值实现图像的二值化分割是一种重要且实用的图像分割技术.本文提出了一种基于模糊聚类的二值化方法.这种方法将模糊C-均值算法加以推广(GFCM)后,应用于图像的二值化分割.通过与Otsu阈值法的分割结果比较后表明,该方法的分割效果好,分割耗时少且适用性强.  相似文献   

3.
基于直方图分析和OTSU算法的文字图像二值化   总被引:2,自引:0,他引:2  
在基于灰度图像的文字提取中,文本图像的二值化算法的优劣直接影响到字符识别的性能。本文对比几种常用的二值化算法,提出一种改进的直方图分析和OTSU算法相结合的算法,该算法利用对直方图信息的区间分析和分类,缩小了查找阈值的范围,最后再利用OTSU求出最优阈值。实验结果表明,该方法能够有效降低光线对OTSU算法的影响,具有较好的分割普适性。  相似文献   

4.
本文提出一种基于全卷积神经网络的图像中文字目标语义分割算法和一种新的数据集制作与增广方法. 该算法首先采用改进全卷积神经网络对图像中的文字目标进行初步分割, 然后利用大津法进行二值化处理, 划分出目标的大致区域, 最后用全连接条件随机场算法进行修正, 得到最终结果. 该算法在测试集上准确率为85.7%, 速度为0.181秒/幅, 为图像目标区域的进一步分析做准备.  相似文献   

5.
基于局部最大方差分割的图像二值化算法   总被引:4,自引:0,他引:4  
本文着重论述了基于局部的阈值分割二值化算法。在阐述了几种基于局部的阈值分割算法后,重点讨论了作者提出的局部最大方差分割法,并比较了该算法与其它局部分割算法的分割效果。结果表明,该算法对目标与背景灰度混叠严重的图像具有很好的分割效果。  相似文献   

6.
侯品  郭庆昌 《自动化博览》2009,26(10):72-73
根据红外图像的特点,提出了一种测量目标红外辐射面积的算法。采用二维otsu算法和变闽值统计平均算法的目标图像进行分割算法,采用均值算法和中值算法去除图像噪声,采用二维otsu算法初二值化去噪后图像,在以此阂值为基准变换闽值得到一组二值化后图像,统计平均二值化后的图像,设定阀值得到最终二值化结果,在结合原图像得到分割结果。最后通过与一维和二维otsu图像分割算法试验比较,验证了此算法的有效性。  相似文献   

7.
针对网格图像文字自动识别受网格横线影响的问题,提出将网格图像按照网格横线进行行分割的自适应阈值算法。在对网格图像行分割过程中,首先对灰度图像使用类别方差自动门限法(OSTU算法)取得图像二值化的阈值,将此阈值作为全局阈值对图像进行二值化操作。然后针对图像的二值化数据进行了水平投影,利用统计法取得行分隔的阈值,并结合行分隔阈值实现了网格图像行分割的算法。最后将算法在Matlab中进行了验证和分析。  相似文献   

8.
为了准确测量传送带上的矿石尺寸,提出了一种局部自适应阈值化和改进的分水岭变换相结合的矿石图像分割算法.该算法利用基于积分图像的自适应阈值化算法提取矿石区域;对二值图像做距离变换与双边滤波处理,并应用提出的基于区域合并的分水岭变换算法对图像进行分割;将提取的矿石区域与分割结果进行合并,得到最终的分割结果.对现场采集的复杂的矿石图像进行仿真实验,实验结果表明,该算法分割准确、速度快、光照自适应强.  相似文献   

9.
描述纸币图像的二值化和字符的分割方法.针对纸币图像的特点,提出一种基于最大方差比的图像二值化算法,并利用自适应遗传算法(Adaptive Genetic Algorithm,AGA)得到最优的阈值.该算法的思想是将图像分成两个类,选取类间方差与类内方差的分离度为适应度函数,当分离度取最大值时对应的灰度值为最优的阈值,实验表明,以此阈值对图像分割能快速准确的对纸币图像二值化.最后讨论基于投影法的纸币字符分割的方法,并且取得比较满意的效果.  相似文献   

10.
多数图像因为背景复杂,文字的结构、颜色、灰度值不确定,导致文字分割困难,复杂背景图像的文字分割近些年受到大量的关注与研究,但多数都是基于某些特定条件进行文字分割或者需要手动设置参数,适用范围具有很大的局限性。针对以上问题提出了一个计算效率高,适应性强而且无监督实现的算法:基于K均值聚类的复杂背景图像的文字分割算法。算法针对文字的笔画特征使用增强Sobel的算子响应度作为判决与反馈条件,自适应的决定出最佳聚类数的值,分割出最佳的文字图像。实验结果表明,对具有复杂背景的文字图像,算法具有较准确的分割效果与实时的分割速度,抗噪声能力也具有一定的优越性。  相似文献   

11.
版面分割是版面分析的重要组成部分,经过大量的研究,如今已到了一个比较成熟的阶段。对基于连通域的版面分割算法进行了改进,能有效快速地分割较为复杂的版面图像,同时有效减少原有算法中阈值引起的分割错误的情况。先对文本图像进行单个字体的区域扩充,使后续的连通间距统计更为准确和方便,再通过连通间距的统计对图像进行模糊整合,进行文本图像的连通区域分割。实验结果表明,改进的基于连通域的算法分割版面准确,速度快,适用范围广,对于较为复杂的版面分割更具有优越性。  相似文献   

12.
为了在视频图像中进行字幕信息的实时提取,提出了一套简捷而有效的方法。首先进行文字事件检测,然后进行边缘检测、阈值计算和边缘尺寸限制,最后依据文字像素密度范围进一步滤去非文字区域的视频字幕,提出的叠加水平和垂直方向边缘的方法,加强了检测到的文字的边缘;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘。应用投影法最终确定视频字幕所在区域。最后,利用OCR识别技术对提取出来的文字区域进行识别,完成视频中文字的提取。以上方法的结合保证了提出算法的正确率和鲁棒性。  相似文献   

13.
许肖  顾磊 《计算机科学》2016,43(4):313-317
针对复杂背景下的文本检测问题,提出了显著性检测与中心分割算法相结合的文本检测技术。对于输入的图像,首先分别使用前景与背景作为标准的显著性检测方法,背景检测时将图像的四边分别作为基准,前景检测时将背景检测中得到的非背景区域作为基准,最终可得到较准确的备选文本区。然后使用中心分割算法,得到精确的边缘图。由于显著性图备选区域准确边缘细节缺失,而边缘图边缘精确但无法得出备选文本区,因此将两者进行融合处理,得到最终文本区域。实验表明,所提出的方法有较好的检测效果。  相似文献   

14.
针对古代汉字文档的特点,提出了适合于古文档的列切分方法和字切分方法。提出的列切分方法直接对文档的笔画投影进行分析,采用一种基于分层投影过滤和变长间隙阈值的递归切分算法。该算法在列间隔较小、列与格线存在粘连、文档具有一定程度的倾斜的情况下,也能准确地抽取出列,尤其对短列的切分达到了较好的效果。提出的字切分方法分为两步,进行粗切分确定大致的切分位置,采用基于连通域分析与粘连点判断的方法做进一步的细切分。该算法对具有较多粘连和重叠汉字的列,也能较好地切分出完整的单字。实验结果表明,提出的方法用于古代汉字文档切分能够获得较好的效果。  相似文献   

15.
针对静爆试验中拍摄的图像中破片目标小、背景复杂等情况,基于经典阈值分割法在破片图像分割的应用中存在不能将目标所在像素准确分离的问题,提出一种基于蜜獾算法(HBA)的多阈值图像分割方法,该方法引入HBA求解Tsallis相对熵的最小值作为目标函数值来计算最佳阈值,在分析经典阈值分割方法处理破片图像的不足后,选择合适的阈值数,将HBA与遗传算法(GA)、蝗虫优化算法(GOA)、麻雀搜索算法(SSA)三种优化算法进行性能对比,利用分离出的目标绘制破片轨迹图并确定有效破片。分析结果表明,阈值数为2时分割效果满足需求,HBA运行时间1.32 s,进行100次重复实验后其结果的标准偏差约为0,分割出的目标中有效破片达83.8%,说明该算法的实时性和稳定性强,分割效果可满足对破片群运动参数测试的需求。  相似文献   

16.
Selection of optimal threshold is the most crucial issue in threshold-based segmentation. In case of color image, this task is become challenging, because conventional color image segmentation has computational complexity and also it suffers from lack of accuracy. Various techniques such as threshold based, region growing, edge detection, graph cut, pixel classification, neural network, active contour, gray level co-occurrence matrix are proposed so far for image segmentation in the literature. Out of them, threshold-based segmentation is popular for its simplicity. To address the problem of color image segmentation, we propose an enhanced version of metaheuristic optimization algorithm called Opposition based Symbiotic Organisms Search (OSOS) to solve multilevel image thresholding technique for color image segmentation by introducing opposition based learning concepts to accelerate the convergence rate and enhance the performance of standard symbiotic organisms search (SOS). The performance of the proposed OSOS based algorithm is investigated thoroughly and compared with some existing techniques like Cuckoo Search (CS), BAT algorithm (BAT), artificial bee colony (ABC) and particle swarm optimization (PSO). The comparison is made by applying the algorithm to a set of color images taken from a well-known benchmark dataset (Berkeley Segmentation Dataset (BSDS)) and some of the color images collected for the COCO dataset. It is observed from the results that the performance of the OSOS based algorithm is promising with respect to standards SOS and others in terms of the values of objective functions as well as the values of some well-defined quality metrics such as peak signal-to-noise ratio (PSNR), structure similarity index (SSIM) and feature similarity index (FSIM). The results of the proposed algorithm may encourage the scientists and engineers to apply it into pattern recognition problems.  相似文献   

17.
刘晓佩 《控制与决策》2015,30(11):1987-1992

针对复杂场景文本难以有效分割的问题, 提出一种复杂场景文本分割方法. 首先, 使用简单的线性迭代聚类(SLIC) 算法将原始图像分割为若干局部区域, 并在其区域邻接图上构建图割模型; 然后, 采用高斯混合模型(GMMs) 和支持向量机(SVM) 后验概率模型对场景文本进行建模, 并引入每个局部区域与模型之间的匹配度用于计算似然能. 为了增强GMMs的鉴别力, 在参数学习中引入模型性能描述子, 自适应地获得模型参数. 实验结果表明,所提出的算法能够较好地处理复杂场景文本分割问题, 文本的识别率得到了明显的提升.

  相似文献   

18.
Text segmentation using gabor filters for automatic document processing   总被引:24,自引:0,他引:24  
There is a considerable interest in designing automatic systems that will scan a given paper document and store it on electronic media for easier storage, manipulation, and access. Most documents contain graphics and images in addition to text. Thus, the document image has to be segmented to identify the text regions, so that OCR techniques may be applied only to those regions. In this paper, we present a simple method for document image segmentation in which text regions in a given document image are automatically identified. The proposed segmentation method for document images is based on a multichannel filtering approach to texture segmentation. The text in the document is considered as a textured region. Nontext contents in the document, such as blank spaces, graphics, and pictures, are considered as regions with different textures. Thus, the problem of segmenting document images into text and nontext regions can be posed as a texture segmentation problem. Two-dimensional Gabor filters are used to extract texture features for each of these regions. These filters have been extensively used earlier for a variety of texture segmentation tasks. Here we apply the same filters to the document image segmentation problem. Our segmentation method does not assume any a priori knowledge about the content or font styles of the document, and is shown to work even for skewed images and handwritten text. Results of the proposed segmentation method are presented for several test images which demonstrate the robustness of this technique. This work was supported by the National Science Foundation under NSF grant CDA-88-06599 and by a grant from E. 1. Du Pont De Nemours & Company.  相似文献   

19.
基于最大互信息量的图像自动优化分割   总被引:3,自引:0,他引:3       下载免费PDF全文
由于传统的阈值分割算法只考虑到图像的灰度信息,而忽略了灰度的空间分布以及分割后图像与原图像之间的关系,因而分割效果不好。为了提高分割效果,从分割图像与原图像的内在联系出发,提出了一种新的基于K均值算法与互信息量(mutual information,MI)技术相结合的分割算法。新算法首先利用K均值算法确定全局阈值作为初值;然后以互信息量为目标函数,在小范围内计算分割图像与原图像的互信息量,互信息量达到最大时的阈值即为最优值。这是将图像配准方法用于分割的一种创新性尝试。通过对大量医学图像以及汽车牌照图像进行的实验结果表明,该新算法所得到的目标图像的边界特征保持完好,不仅虚假目标信息大大降低,而且图像边界细腻、连续,且定位性能好。  相似文献   

20.
为了能对复杂版式的文本图像(如包含镶嵌在文字中的形状不规则的图片区)的页面进行图文分割与分类,提出了一种新的基于模式链分析的文本页面分割与分类算法。该算法首先使用外接矩形框出图像中的所有黑像素,并且存入矩形框链表中,再组合所有相邻的矩形进而形成模式,最后依据各模式的统计特征分类,输出文字区和图片区两类图像。另外,对大图片模式周围个别不确定的模式,本文采用了上下文分类的算法进行再次分类。实验结果表明,该算法不仅运算速度快,而且能够对复杂版式的页面图像进行正确的图文分割和分类。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号