共查询到19条相似文献,搜索用时 140 毫秒
1.
2.
3.
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在... 相似文献
4.
研究摄影文档图像几何畸变的数学模型,分析了其中关键的几何关系,并在前人工作成果的基础上,进一步对书籍装订线弯曲的柱面模型进行抽象,得到一种参数化的几何模型。同时以上述参数化的几何模型为指导,设计并实现算法从摄影图像中提取关键信息,估计模型参数,完成畸变图像的倾斜矫正与复原。 相似文献
5.
文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高. 相似文献
6.
由于文档纸张的几何形变、拍摄场景的干扰及拍摄角度不理想导致的透视失真,移动设备获取的文档图像的光学字符识别(Optical character recognition,OCR)性能受到很大挑战。针对折叠和扭曲的畸变文档图像预处理问题,设计了两种基于自编码器的网络结构,以实现自适应性图像矫正并提高文字识别正确率。首先提出空洞残差块和非对称卷积残差块两种残差块,然后将残差块与自编码器相结合,设计了一种非对称空洞自编码器网络;同时利用空间金字塔池化代替全连接层,并用非对称卷积残差块实现特征提取,设计了另一种空间金字塔自编码器网络。实验结果表明,与畸变图像相比,经非对称空洞自编码器网络矫正后的图像在OCR正确率、OCR召回率和文本相似度上分别提高了26.3%、20.4%和12.3%,而经空间金字塔自编码器网络矫正后的图像在正确率、召回率和文本相似度上分别提高了27.7%、22.0%和15.5%。与RectiNet等其他图像矫正网络相比,这两种网络可以自适应矫正多种类型的畸变文档图像,且矫正后的图像在文字识别上表现更为优异。本文提出的两种矫正网络能有效提高图像文字识别正确率、召回率和文本相似度,... 相似文献
7.
8.
9.
针对基于数码相机拍摄的小型文档图像,提出一种集成型的小型文档图像透视变形校正方法.利用小型文档本身面积小,文字数少,版面较复杂的特点,通过彩色图像分割提取小型文档的外边缘并结合小型文档内部的文字信息进行校正.实验表明,该方法能够有效地对小型文档图像进行快速准确的校正. 相似文献
10.
《计算机应用与软件》2016,(7)
针对低质量文档图像中存在的墨迹浸润、页面污渍或背景纹理等退化因素,提出一种低质量文档图像二值化算法。算法首先基于文档图像的局部对比度实现字符笔画像素检测,然后采用Otsu算法对其进行全局最优阈值化处理,最后通过估计字符笔画宽度确定邻域窗尺寸,从而实现字符前景与页面背景的精细分割。实验结果表明,该算法在F-measure、PSNR、SSIM、NRM、DRD等性能指标方面较其它经典的文档二值化算法具有明显优势。该算法不仅能够较好地保留笔画细节外,还能够较好地抑制文档背景。 相似文献
11.
12.
车辆牌照识别是智能交通系统的重要组成部分,而车牌图像的分割定位与字符提取是车牌识别系统的关键步骤,定位提取效果直接决定了车牌识别系统的工作效率。斜向拍摄的车牌图像存在着透视变形,该情况下直接进行车牌旋转不能有效地矫正,必须进行变形矫正才能准确地提取出各个牌照字符。文中利用双线性空间映射来矫正变形车牌图像,采用高斯消元法来计算该映射方程组的解,从而较好地解决了车牌透视变形的矫正问题,提高了车牌图像变形矫正的运算精度与速度。 相似文献
13.
14.
苗立刚 《中国图象图形学报》2009,14(8):1656-1662
为了把手持相机拍摄的多幅文档图像拼接成一幅大的图像,提出了一种基于全局对准模型的文档图像拼接算法。该算法首先通过估计文档图像的消隐点坐标来校正透视失真,使相邻图像的几何关系可以用仿射变换表示;然后采用随机采样方法调整特征点之间的距离,使其尽可能均匀地分布在整个重叠区域内;接着利用所有重叠图像对的局部对准约束通过建立文档图像拼接的全局对准模型来有效地消除误差积累;最后利用二值函数对图像进行剪切,以减小重叠区内的对准误差。实验结果表明,该方法无需事先标定摄像机的内外参数和限制相机的位置,不仅具有较高的对准精度,且可有效地拼接手持相机拍摄的各种文档图像。 相似文献
15.
文档在扫描输入过程中,所生成的页面图像一般都存在一定的角度倾斜,当页面图像倾斜角度过大时,将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量,提出了一种基于视窗变换的页面图像倾斜检测方法,该算法首先对视窗中的文字及图片的细节部分进行模糊,然后对其边沿进行直线拟合,以便快速检测页面图像倾斜角度。实验结果表明,该方法能快速准确地检测出各类页面图像的倾斜角度,并具有良好的适应性。 相似文献
16.
识别文档图像中的文字,有助于人们管理和使用信息.MODI作为Microsoft Office内建的免费文字识别组件,使开发人员可以方便地,以较低的成本处理文档图像.本文通过研究MODI组件的OCR模块的特点和二次开发,以及与其他商业OCR软件的对比,验证了MODI在文档图像处理方面具有较高的可靠性和应用价值. 相似文献
17.
立体校正作为立体匹配的先决条件,能消除图像对对应像素的垂直视差,有效地提高立体匹配的精确度.针对校正带来的图像失真问题,研究了一种新的非标定相机的立体校正方法.该方法首先利用SIFT算法提取匹配点,再结合极线校正准则和雅可比行列式来构建能量函数,通过最小化能量函数求得基础矩阵和校正投影变换矩阵,并在像素级上优化了投影变换矩阵.研究结果表明:所设计的校正方法有效地减小了校正误差,更好地保持了原图像的重采样,降低了图像的失真度. 相似文献
18.
19.
从原装订本上扫描文件页面往往会导致扫描图像扭曲的情况。该文简要先介绍了SFS方法及分类。然后提出从技术的角度看利用SFS重构扫描图像这一问题。在现实环境中扫描图像有如下特征:1)一个靠近的移动光源;2)Lambertian式光反射;3)文件偏斜。然后利用基于去除灰度和去除变形模式的方法来恢复扫描文件图像。用以重构书曲面的图像,恢复扫描图像。 相似文献