期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

刘婀娜刘一斐祁建芳《计算机应用研究》2007,24(7):315-317

针对照相机对装订书籍拍照时由于书面弯曲产生文档图像变形的问题,利用从图像中提取的文档边缘作为特征信息,通过参数控制自动实现文档图像的矫正.与以往研究成果相比,本方法无须人工标记及特殊设备,具有一定的优越性.实验结果能够有效地对变形文档图像进行矫正. 相似文献

2.

基于图像处理的文档图像矫正系统研究与设计

孙丹阳邵坤艳孙春志程文静舒方杰《电脑与信息技术》2023,(3):20-23

文章提出一种基于图像处理的文档图像矫正系统,该系统首先对文档图像进行高斯滤波、局部边缘提取及膨胀操作,然后提取轮廓,最后基于Hough变换算法找到可以覆盖所有轮廓的最小矩形并生成仿射变换矩阵进行变换矫正。该方法相比传统的基于Hough变换的方法,增加基于图像处理的滤波及形态学处理,使矫正效果更好;相比其他常见的基于模式识别进行图像矫正的方法,抗干扰能力更强;相比常见的基于深度学习进行图像矫正的方法,运算速度快,模型小,更适合在智能手机等移动端使用。相似文献

3.

面向智能手机拍摄的变形文档图像校正

周丽冯百明关煜方格《计算机工程与科学》2022,44(1):102-109

智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在... 相似文献

4.

摄影文档图像倾斜矫正研究

程仁峰徐赐文《计算机应用》2007,27(B06):152-154

研究摄影文档图像几何畸变的数学模型，分析了其中关键的几何关系，并在前人工作成果的基础上，进一步对书籍装订线弯曲的柱面模型进行抽象，得到一种参数化的几何模型。同时以上述参数化的几何模型为指导，设计并实现算法从摄影图像中提取关键信息，估计模型参数，完成畸变图像的倾斜矫正与复原。相似文献

5.

基于多级文本检测的复杂文档图像扭曲矫正算法

寇喜超张鸿锐冯杰郑雅羽《计算机科学》2021,48(12):249-255

文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高. 相似文献

6.

面向畸变扭曲文档的两种图像矫正网络

冯瑾池越周亚同何静飞《数据采集与处理》2024,(1):167-180

由于文档纸张的几何形变、拍摄场景的干扰及拍摄角度不理想导致的透视失真,移动设备获取的文档图像的光学字符识别（Optical character recognition,OCR）性能受到很大挑战。针对折叠和扭曲的畸变文档图像预处理问题,设计了两种基于自编码器的网络结构,以实现自适应性图像矫正并提高文字识别正确率。首先提出空洞残差块和非对称卷积残差块两种残差块,然后将残差块与自编码器相结合,设计了一种非对称空洞自编码器网络;同时利用空间金字塔池化代替全连接层,并用非对称卷积残差块实现特征提取,设计了另一种空间金字塔自编码器网络。实验结果表明,与畸变图像相比,经非对称空洞自编码器网络矫正后的图像在OCR正确率、OCR召回率和文本相似度上分别提高了26.3%、20.4%和12.3%,而经空间金字塔自编码器网络矫正后的图像在正确率、召回率和文本相似度上分别提高了27.7%、22.0%和15.5%。与RectiNet等其他图像矫正网络相比,这两种网络可以自适应矫正多种类型的畸变文档图像,且矫正后的图像在文字识别上表现更为优异。本文提出的两种矫正网络能有效提高图像文字识别正确率、召回率和文本相似度,... 相似文献

7.

基于特征的文档图像高速插值算法

陈义学刘江马磊《微型机与应用》2012,31(24):35-38,41

提出了一种基于文档图像特征的混合插值算法。该算法通过分析文档图像的像素邻域特征,使用邻近插值、双线性插值和双三次样条插值方法估计插值像素灰度值。其中,三次样条插值方法使用了优化算法,即三次样条卷积模板的整数化运算,其时间复杂度接近双线性插值。给出了算法的实现过程。实验结果表明,该算法输出的图像质量接近双三次样条插值,运行效率高于双线性插值算法,在文档图像扫描过程取得了良好的应用效果。相似文献

8.

视觉文档图像的几何校正 总被引：2，自引：0，他引：2

田学东马兴杰韩磊刘海博《计算机应用》2007,27(12):3045-3047

在以数码相机等数字设备拍摄文档资料时,所拍摄的图像经常会产生各种各样的几何变形,这种变形可能会导致识别软件中的版面分析和切分算法失效,从而使文档图像无法被识别。为了使普通的识别软件能够对数码相机等拍摄的文档图像进行识别,有必要对其进行几何校正。根据几何变形产生的原因对其进行了分类,并针对不同种类的变形提出了相应的校正算法。实验结果证明该分类方法和相应校正算法都有较好的效果。相似文献

9.

一种集成的小型文档图像透视变形校正方法

马懿超戴汝为王春恒《模式识别与人工智能》2006,19(4)

针对基于数码相机拍摄的小型文档图像,提出一种集成型的小型文档图像透视变形校正方法.利用小型文档本身面积小,文字数少,版面较复杂的特点,通过彩色图像分割提取小型文档的外边缘并结合小型文档内部的文字信息进行校正.实验表明,该方法能够有效地对小型文档图像进行快速准确的校正. 相似文献

10.

低质量文档图像二值化算法研究

《计算机应用与软件》2016,(7)

针对低质量文档图像中存在的墨迹浸润、页面污渍或背景纹理等退化因素,提出一种低质量文档图像二值化算法。算法首先基于文档图像的局部对比度实现字符笔画像素检测,然后采用Otsu算法对其进行全局最优阈值化处理,最后通过估计字符笔画宽度确定邻域窗尺寸,从而实现字符前景与页面背景的精细分割。实验结果表明,该算法在F-measure、PSNR、SSIM、NRM、DRD等性能指标方面较其它经典的文档二值化算法具有明显优势。该算法不仅能够较好地保留笔画细节外,还能够较好地抑制文档背景。相似文献

11.

改进的文档图像扭曲校正方法

下载免费PDF全文

宋丽丽吴亚东孙波《计算机工程》2011,37(1):204-206

由照相机拍摄的文档图像可能因扭曲变形导致OCR软件不能正确识别。为解决上述问题,采用图像分割技术进行单词及文本线检测,利用线性拟合得到单词的较低基线和较高基线,根据校正基线对单词进行旋转和垂直位移,得到校正后的图像。实验结果表明,该方法能快速有效地校正扭曲的文档图像,使校正后的图像在光学字符识别阶段的识别率有较大提高。相似文献

12.

基于Gauss消元法的车牌图像变形矫正

谢志鹏陈锻生《微机发展》2006,16(1):99-101

车辆牌照识别是智能交通系统的重要组成部分,而车牌图像的分割定位与字符提取是车牌识别系统的关键步骤,定位提取效果直接决定了车牌识别系统的工作效率。斜向拍摄的车牌图像存在着透视变形,该情况下直接进行车牌旋转不能有效地矫正,必须进行变形矫正才能准确地提取出各个牌照字符。文中利用双线性空间映射来矫正变形车牌图像,采用高斯消元法来计算该映射方程组的解,从而较好地解决了车牌透视变形的矫正问题,提高了车牌图像变形矫正的运算精度与速度。相似文献

13.

基于最小化畸变重投影的广义平面校正方法

下载免费PDF全文

郭君斌郭晓松杨必武雷磊《计算机工程》2007,33(22):26-28,7

为了方便计算机视觉中的图像配准和拼接等工作,该文提出了一种最小化畸变平面校正方法。通过求射影变换权值变化测度之和的极值及Jacobian行列式度量校正前后的局部区域变化,求得最小化重采样效果的校正变换矩阵。建立广义平面校正坐标系,在虚拟坐标系内考虑最小化畸变和最小化重采样效果,减少了旋转造成的重采样畸变,改善了可视性。相似文献

14.

基于手持相机的文档图像拼接算法

下载免费PDF全文

苗立刚《中国图象图形学报》2009,14(8):1656-1662

为了把手持相机拍摄的多幅文档图像拼接成一幅大的图像,提出了一种基于全局对准模型的文档图像拼接算法。该算法首先通过估计文档图像的消隐点坐标来校正透视失真,使相邻图像的几何关系可以用仿射变换表示;然后采用随机采样方法调整特征点之间的距离,使其尽可能均匀地分布在整个重叠区域内;接着利用所有重叠图像对的局部对准约束通过建立文档图像拼接的全局对准模型来有效地消除误差积累;最后利用二值函数对图像进行剪切,以减小重叠区内的对准误差。实验结果表明,该方法无需事先标定摄像机的内外参数和限制相机的位置,不仅具有较高的对准精度,且可有效地拼接手持相机拍摄的各种文档图像。相似文献

15.

基于视窗的OCR页面图像倾斜检测方法 总被引：2，自引：0，他引：2

下载免费PDF全文

靳从魏之来杨静宇《中国图象图形学报》2004,9(11):1290-1293

文档在扫描输入过程中，所生成的页面图像一般都存在一定的角度倾斜，当页面图像倾斜角度过大时，将对进一步的版面分析以及字符识别产生不良影响。为了快速准确地检测页面图像倾斜角度和降低计算量，提出了一种基于视窗变换的页面图像倾斜检测方法，该算法首先对视窗中的文字及图片的细节部分进行模糊，然后对其边沿进行直线拟合，以便快速检测页面图像倾斜角度。实验结果表明，该方法能快速准确地检测出各类页面图像的倾斜角度，并具有良好的适应性。相似文献

16.

基于MODI的文档图像处理的研究

顾李晶赵霁《自动化技术与应用》2013,(11):45-47,66

识别文档图像中的文字,有助于人们管理和使用信息.MODI作为Microsoft Office内建的免费文字识别组件,使开发人员可以方便地,以较低的成本处理文档图像.本文通过研究MODI组件的OCR模块的特点和二次开发,以及与其他商业OCR软件的对比,验证了MODI在文档图像处理方面具有较高的可靠性和应用价值. 相似文献

17.

一种基于双目立体视觉的图像校正算法设计

陈蓉罗晓曙《测控技术》2016,35(5):16-19

立体校正作为立体匹配的先决条件,能消除图像对对应像素的垂直视差,有效地提高立体匹配的精确度.针对校正带来的图像失真问题,研究了一种新的非标定相机的立体校正方法.该方法首先利用SIFT算法提取匹配点,再结合极线校正准则和雅可比行列式来构建能量函数,通过最小化能量函数求得基础矩阵和校正投影变换矩阵,并在像素级上优化了投影变换矩阵.研究结果表明:所设计的校正方法有效地减小了校正误差,更好地保持了原图像的重采样,降低了图像的失真度. 相似文献

18.

基于模拟视频信号差分和射影畸变校正的图像系统

应毅辰王晓年朱劲《计算机与现代化》2013,(12):86-90,97

视觉传感器越来越多地应用到嵌入式系统中,通常对视频信号的处理是先对模拟信号数字化,然后再利用嵌入式处理器进行计算。大量的数据和处理器处理能力的差异尤为显著,以至于限制了视觉传感器的广泛使用。本文提出一种基于硬件的模拟差分处理以及射影畸变校正的图像系统,通过像素模拟信号的差分实现边缘检测,同时通过查表校正在摄像头的像平面与地面不平行时产生的图像射影畸变,便于后续的图像处理和模式识别。该方法提高了信号处理的实时性,减轻了视觉传感器对处理能力的依赖。相似文献

19.

基于SFS的方法恢复扫描文件图像

LI Jun GONG Sheng-rong 《数字社区&智能家居》2008,(28)

从原装订本上扫描文件页面往往会导致扫描图像扭曲的情况。该文简要先介绍了SFS方法及分类。然后提出从技术的角度看利用SFS重构扫描图像这一问题。在现实环境中扫描图像有如下特征:1)一个靠近的移动光源;2)Lambertian式光反射;3)文件偏斜。然后利用基于去除灰度和去除变形模式的方法来恢复扫描文件图像。用以重构书曲面的图像,恢复扫描图像。相似文献