首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 180 毫秒
1.
宋丽丽  吴亚东  孙波 《计算机应用》2010,30(12):3317-3320
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,首先采用连通域标记方法进行单词及文本线的检测;然后根据单词中位点信息线性拟合得到其校正基线;最后根据校正基线和垂直位移距离分别对单词进行旋转和位移而得到校正后的图像。与传统方法相比,该方法得到的校正基线和垂直位移距离不受文档具体文字内容的影响,能更加准确地代表单词的倾斜走向,并保证校正后的单词在水平方向上对齐;同时表现出了很好的鲁棒性。经过分析算法的计算复杂度, 并与传统方法相比较, 该算法的效率和鲁棒性较高。  相似文献   

2.
在对文档图像进行光学字符识别时,由于书籍扭曲的存在,识别率会降低。对于 含有页眉页脚线的扭曲文档图像,提出一种快速校正方法。首先分别检测并定位图像中的页眉 线,保存页眉线的坐标信息。根据等比算法计算页眉线上各点在校正时所需向上或向下移动的 距离,然后以此距离为参数扫描图像,计算页眉页脚线之间的各个目标像素校正所需移动的距 离,同时进行像素点的移动重构图像,最终得到校正的图像。实验结果表明,该方法校正效果明显, 对于包含页眉页脚线的扭曲文档图像有较好的校正效果,校正后OCR 识别率大幅度提高。  相似文献   

3.
基于游长平滑的文档图像倾斜校正   总被引:7,自引:0,他引:7  
图像获取设备将纸质文档转换为文档图像时,文档图像不可避免地存在一定的倾斜。目前,对于倾斜文档图像的处理仍然存在许多困难,因此有必要对倾斜的文档图像进行倾斜校正。但是文档版面十分复杂,包含文字、图像、图形和表格等内容,所以文档图像倾斜校正存在着一定的困难。文章提出了基于游长平滑处理的文档图像倾斜校正方法,实验表明该方法具有倾斜校正速度快、精度高和适应性强的特点。已经在重庆市北碚区档案管理数字化系统中得到成功应用。  相似文献   

4.
在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像有较好的校正效果,校正后识别率大幅度提高。  相似文献   

5.
针对OCR 在识别文本图像时,由于扭曲造成的中英文混排文本图像识别率不理想 的情况,提出一种快速扭曲校正方法。图像经过预处理后,首先利用形态学膨胀定位文本行, 得到各文本行上下边界;分别对每个文本行参考垂直投影信息进行文字切分,获得字符包围盒; 然后根据中英文的不同特点在每个文本行中逐个对字符位置进行校正,最终实现图像重构。实 验结果表明,该方法校正速度快、精度高,对于中英文混排扭曲文档图像有较好地校正效果, 校正后图像OCR 识别率有明显提高。  相似文献   

6.
基于最小二乘法的文档图像倾斜检测方法   总被引:9,自引:0,他引:9  
在文档扫描过程中,输入的文档图像不可避免地会发生倾斜现象,而布局分析及字符识别算法对页面倾斜都十分敏感,因此倾斜检测和校正是文档分析预处理的重要环节。本文提出了一个基于最小二乘法的倾斜检测方法。它将字符连通区包围盒底边中心点作为特征点,利用文本行中特征点与基线的关系,将特征点用最小二乘法拟事出基线的方向,即为页面倾斜方向。同时,本文介绍了一种基于直线拟合的快速倾斜校正算法。实验证明,该算法速度快,准确度高。  相似文献   

7.
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在...  相似文献   

8.
拍摄或扫描图书文档时,所获得的页面图像会有不同程度的扭曲形变,这不仅影响美观或视觉效果,而且影响其深层处理,如OCR(Optical Character Recognition)字符识别。为解决上述问题,提出一种改进的基于模型的扭曲页面校正算法。首先对输入图像进行转正预处理,并通过以图像梯度信息确定阈值的二值化方法去除页面的灰色背景,然后利用简易的直线结构光提取页面文字行点集,由点集中心点曲线构建柱面模型进行页面校正。实验表明该方法能适应更多不同的页面扭曲类型,校正和去背景处理效果好、效率高,可显著提高OCR识别率,而且系统结构简便,容易实现。  相似文献   

9.
彩色文档图像的倾斜自动校正算法   总被引:6,自引:0,他引:6       下载免费PDF全文
对彩色扫描文档进行倾斜校正是对其进行OCR等处理所必须首先经历的步骤,为了对彩色倾斜文档图像进行准确、高效校正,提出了一种新的彩色文档图像的倾斜自动校正算法,该算法包括倾斜检测算法和倾斜校正算法。其中,倾斜检测算法解决了准确获得图像的倾斜角的问题;而倾斜校正算法则除了完成图像的旋转变换外,还通过色彩补偿解决了由于整数运算所造成的“锯齿”现象。倾斜检测是通过纹理复杂性分析实现的,而色彩补偿则是基于颜色线性相关的双线性插值算法。实验表明,该算法较好地解决了彩色文档图像的倾斜自动校正问题,它对于具有单一背景的彩色文档图像是准确、高效、实用的。  相似文献   

10.
基于投影的文档图像倾斜校正方法   总被引:5,自引:0,他引:5       下载免费PDF全文
针对文档图像的倾斜校正问题,提出了一种新的基于投影的文档图像倾斜角检测方法。首先采用一种高效的像素遍历算法对文档图像从不同角度进行投影,然后对投影数据进行累加求和,通过比较不同角度下的累加和来确定倾斜角度。该方法在投影过程中只需对文档图像进行极少部分投影,因而大大减少了运算量。基于该方法的特点,提出了由“粗”到“精”的投影策略,在确保检测精度的同时大幅提高了检测速度。实验结果表明,方法非常有效,可以获得很高的检测精度。  相似文献   

11.
目的 以词袋模型为基础的拷贝图像检索方法是当前最有效的方法。然而,由于局部特征量化存在信息损失,导致视觉词汇区别能力不足和视觉词汇误匹配增加,从而影响了拷贝图像检索效果。针对视觉词汇的误匹配问题,提出一种基于近邻上下文的拷贝图像检索方法。该方法通过局部特征的上下文关系消除视觉词汇歧义,提高视觉词汇的区分度,进而提高拷贝图像的检索效果。方法 首先,以距离和尺度关系选择图像中某局部特征点周围的特征点作为该特征点的上下文,选取的上下文中的局部特征点称为近邻特征点;再以近邻特征点的信息以及与该局部特征的关系为该局部特征构建上下文描述子;然后,通过计算上下文描述子的相似性对局部特征匹配对进行验证;最后,以正确匹配特征点的个数衡量图像间的相似性,并以此相似性选取若干候选图像作为返回结果。结果 在Copydays图像库进行实验,与Baseline方法进行比较。在干扰图像规模为100 k时,相对于Baseline方法,mAP提高了63%。当干扰图像规模从100 k增加到1 M时,Baseline的mAP值下降9%,而本文方法下降3%。结论 本文拷贝图像检索方法对图像编辑操作,如旋转、图像叠加、尺度变换以及裁剪有较高的鲁棒性。该方法可以有效地应用到图像防伪、图像去重等领域。  相似文献   

12.
目的 色彩纠正和图像融合是生成高质量全景场景图像的关键技术。色彩纠正中参考图像的选择以及图像融合算法,决定着所生成全景图像的质量和速度。现有方法在确定一幅图像是否适合作为参考图像时,需要遍历所有其他图像,计算其作为参考图像进行色彩纠正的效果,复杂度高,速度慢;在图像融合时存在融合质量与融合速度之间的矛盾。因此,如何快速生成高质量的全景图像就成为全景场景再现的主要诉求。为此本文提出优化的参考图像自动选择的色彩纠正方法和基于重叠区域划分的分区融合方法。方法 针对参考图像选择算法复杂度高的问题,根据图像质量与稳定性通常呈反比关系的事实,采用贪婪策略,选择质量最差的图像在色彩纠正前后的相似度,作为是否选择当前图像作为参考图像的评价指标,在保证参考图像满足色彩纠正需求的前提下,大幅降低计算复杂度。针对融合质量与融合速度之间的矛盾,提出分区融合:将重叠区域划分为接缝区域和非接缝区域,利用泊松融合的接缝不可见性和线性融合实现速度快的特性分别对接缝区域和非接缝区域进行融合,既保证融合的质量,又加快融合速度。在此基础上,加入简单点光源,解决上述过程产生的光线一致性问题,进一步提高图像质量。结果 采用主观和客观相结合的方法对结果进行评估。主观方面,本文算法生成的全景图像色彩基本实现平滑过渡且图像原始信息保留完整。客观方面,色彩纠正前后图像的结构相似度(SSIM)控制在0.850.99之间,时间复杂度由原来的O(n2)降低到O(n);分区融合后图像信息熵接近于泊松融合,但时间消耗降低72%。采用基于PC端的问卷调查法和OG-IQA算法将本文算法与PTGui、OpenCV、Xiong方法生成的全景图质量进行对比,在大多数情况下本文算法均优于上述算法。结论 实验表明,本文算法适用于多种场景,在保证目视效果良好的前提下,时间消耗降低,可广泛应用于医学、数字旅游、遥感等领域。  相似文献   

13.
规则网格是视觉词袋模型中常用的图像检测方法,该方法抽取图像所有区块,获得背景区块和目标区块完整的图像信息。事实上,抽取的背景区块信息对类别的判定往往会有一定的混淆作用。以“摩托车”类和“小汽车”类的图像为例,这两类图像背景特征相似,大多都是道路,一般的分类方法很可能将它们分为相同类别。可见,背景信息会干扰图像分类结果。因此,提出一种提取目标区域词袋特征的图像分类方法。利用图像分割去除背景信息提取目标区域;对目标区域构建视觉词袋模型;使用SVM分类器对图像进行分类。PASCAL VOC2006及PASCAL VOC2010数据集上的实验结果表明,提取目标区域词袋特征的图像分类方法具有较好的分类性能。  相似文献   

14.
粗糙集理论已经成功应用于许多领域,特别是数据挖掘、知识发现、人工智能和信息系统分析。在粗糙集理论背景下.对图像进行建模,用集合的上下近似表示图像对象。通过定义新的图’像相似度计算“Object Similarity Ratio”,介绍一种精确的基于对象的图像检索方法,它可以处理基于例图的查询,并且介绍了一种高效的大型图像库检索算法。  相似文献   

15.
Bag-of-Words模型对于图片分类来说是一种非常有用的技术,它利用事先定义好的“可见字”为每张图片建立一个特征向量。提出了一种新的统计方法来发掘可见字对于每一类图片的区分能力,再利用线性模型合并“可见字”,从而为每张图片构造新的特征向量。实验结果显示这一算法能够增强特征向量的区分度,进而提高图片分类的性能。  相似文献   

16.
获得清晰准确的水下图像是人类探索水下世界的重要前置条件。然而与平常图像相比,水下图像往往具有对比度低、细节保留不足及颜色失真等问题,这导致其视觉效果不佳。针对上述问题,提出了基于人工欠曝光融合和白平衡技术(AUF+WB)的水下图像增强算法。首先,利用调节伽马值的方式对原始水下图像进行操作,从而生成5幅相应的欠曝光图像;然后,以对比度、饱和度及良好曝光度作为融合权重,并结合多尺度融合来生成融合图像;最后,将各类颜色通道补偿后的图像分别结合灰色世界假设白平衡生成相应的白平衡图像,再利用水下彩色图像质量评价指标(UCIQE)及水下图像质量评价标准(UIQM)对得到的白平衡图像进行评价。通过选取不同类型的水下图像作为实验样本,将AUF+WB算法与现存先进的水下图像去雾算法进行比较,结果表明AUF+WB算法在图像质量定性、定量两方面分析中和对比算法相比均有更好的表现。所提出的AUF+WB算法可矫正水下图像的颜色失真,并增强其对比度、恢复其细节,有效提升了水下图像的视觉质量。  相似文献   

17.
传统插值算法容易产生细节模糊和边缘锯齿效应,而边缘是图像的重要信息,直接影响插值图像的视觉效果。为了解决这一问题,提出了一种新的基于误差修正的自适应边缘保持插值算法。首先将原图像向插值图像进行映射,再定义一个3×3的滑动窗口,用水平和垂直两个模板确定边缘类型,根据边缘类型进行插值,最后对仍未定义像素点用插值误差定理进行处理,总体上对所有像素都进行了分情况插值处理。实验结果表明,本算法有效地保持了图像的边缘信息,能够获得视觉质量较好的插值图像,且算法比较简单,容易实现。  相似文献   

18.
图像规格化中的期望均值和方差值的选取,直接影响图像规格化后的质量和后续图像的处理。通过求取一组图像中少部分指纹图像的灰度边界值,对图像的期望均值和方差进行估计,并应用于该组中的其他指纹图像,可以使指纹图像获得较大的动态范围,而不至于使图像灰度受到限幅,从而实现对图像期望值的自动估计。实验结果表明,该方法简单可靠,能在不降低对比度情况下,保持图像的灰度层次。该方法鲁棒性好,能适应各种不同图像,是图像规格化的实用方法。采用该方法对图像的期望值进行自动估计,有利于自动指纹识别算法的改进以及采集设备无关性的相关研究。  相似文献   

19.
一种基于视觉单词的图像检索方法   总被引:1,自引:0,他引:1  
刁蒙蒙  张菁  卓力  隋磊 《测控技术》2012,31(5):17-20
基于内容的图像检索技术最主要的问题是图像的低层特征和高层语义之间存在着"语义鸿沟"。受文本内容分析的启发,有研究学者借鉴传统词典中用文本单词组合解释术语的思路,将图像视为视觉单词的组合,利用一系列视觉单词的组合来描述图像的语义内容。为此,利用SIFT进行图像的视觉单词特征提取,然后构建视觉单词库,最后实现了一个基于视觉单词的图像检索系统。实验结果表明,该方法在一定程度上提高了图像检索的查准率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号