期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

寇喜超张鸿锐冯杰郑雅羽《计算机科学》2021,48(12):249-255

文档的扭曲矫正是进行文档OCR(Optical Character Recognition)的基础步骤,对提高OCR的准确率有重要作用.文档图像的扭曲矫正常常依赖于文本的提取,然而目前文档图像矫正算法大都无法对复杂文档中的文本进行准确定位和分析,导致其矫正效果不理想.针对此问题,提出了一种基于全卷积网络的文字检测框架,并使用合成文档对网络进行针对性训练,可实现对字符、词、文本行三级文本信息的准确获取,进而对文本进行自适应采样并利用三次函数对页面进行三维建模,将矫正问题转化为模型参数优化问题,达到矫正复杂文档图像的目的.使用合成扭曲文档以及真实测试数据进行矫正实验,结果表明,提出的矫正方法能够对复杂文档进行精确的文本提取,明显改善了复杂文档图像矫正后的视觉效果,相比于其他算法,该算法矫正后OCR的准确率得到显著提高. 相似文献

2.

变形文档图像的矫正方法研究

刘婀娜罗予频华成英《微计算机信息》2007,23(3):260-262

针对文档表面易发生弯曲变形从而影响文档图像识别率这一问题,通过建模恢复文档表面形状,并运用参数化插值的方法实现了变形文档图像的矫正。本文讨论了基本理论及方法,并对算法的设计及实验中开发的平台进行了介绍,实验数据表明本方法可以有效的实现文档图像的矫正。相似文献

3.

基于特征的文档图像高速插值算法

陈义学刘江马磊《微型机与应用》2012,31(24):35-38,41

提出了一种基于文档图像特征的混合插值算法。该算法通过分析文档图像的像素邻域特征,使用邻近插值、双线性插值和双三次样条插值方法估计插值像素灰度值。其中,三次样条插值方法使用了优化算法,即三次样条卷积模板的整数化运算,其时间复杂度接近双线性插值。给出了算法的实现过程。实验结果表明,该算法输出的图像质量接近双三次样条插值,运行效率高于双线性插值算法,在文档图像扫描过程取得了良好的应用效果。相似文献

4.

基于改进BRISK算法的单目视觉里程计

冯钧黄多辉《计算机与现代化》2018,(9):62

在传统的BRISK算法中使用自定义的抽样模式来描述检测到的特征点,使用基于汉明距离的方法进行特征点匹配。BRISK的这种特征点描述与匹配的方法使得其匹配准确率不高。因此本文提出将匹配准确率较高的SURF算法与BRISK算法相结合,在BRISK特征点描述与匹配阶段使用SURF描述符和基于欧氏距离的匹配方法。实验结果表明,该算法在时间消耗下降不大的情况下,特征点匹配准确率有很大提高,且该算法具有较好的鲁棒性。相似文献

5.

基于图像处理的文档图像矫正系统研究与设计

孙丹阳邵坤艳孙春志程文静舒方杰《电脑与信息技术》2023,(3):20-23

文章提出一种基于图像处理的文档图像矫正系统，该系统首先对文档图像进行高斯滤波、局部边缘提取及膨胀操作，然后提取轮廓，最后基于Hough变换算法找到可以覆盖所有轮廓的最小矩形并生成仿射变换矩阵进行变换矫正。该方法相比传统的基于Hough变换的方法，增加基于图像处理的滤波及形态学处理，使矫正效果更好；相比其他常见的基于模式识别进行图像矫正的方法，抗干扰能力更强；相比常见的基于深度学习进行图像矫正的方法，运算速度快，模型小，更适合在智能手机等移动端使用。相似文献

6.

融合深度信息的BRISK改进算法

张恒刘大勇刘艳丽聂晨曦《计算机应用》2015,35(8):2285-2290

为了有效地利用RGB-D图像的深度信息,提高BRISK算法的尺度不变性和旋转不变性,提出一种融合深度信息的BRISK改进算法。首先,采用FAST算法提取特征点,并计算每个特征点的Harris角点响应值;然后,将整个图像划分为大小相同的网格,每个网格保留Harris角点响应值最大的特征点;其次,根据图像的深度信息直接计算特征点的尺度因子;最后,计算以特征点为中心的圆的灰度矩心,通过灰度矩心和特征点的位置偏差确定特征点主方向。从尺度不变性和旋转不变性两方面对几种算法进行了对比实验分析。实验结果表明,相比BRISK算法,改进后的算法在图像尺度变化时正确匹配特征点数提高了90%以上,在图像旋转时正确匹配特征点数提高了至少70%。相似文献

7.

数学形态学和投影方差在文档图像倾斜校正中的应用

张吉玲王希常刘江《福建电脑》2008,(3):100-100,104

文档图像处理技术已取得很多进展,但是,对于倾斜图像的理解还存在困难。本文对文档图像的倾斜校正进行了研究,根据文档图像的结构特征,给出了基于数学形态学和投影方差相结合的算法,先使用数学形态学进行形态学运算,强化文档图像地结构特征,再使用细化算法,保证投影方差的准确性,最后使用投影方差,进行文档图像的倾斜校正。实验表明,本文提出的算法可以有效的应用于文档图像的倾斜校正。相似文献

8.

基于图像识别的标记阅读机研究

王虎吴海辉《数字社区&智能家居》2007,1(2):1076-1077,1082

阐述了基于图像识别的信息填涂卡文档图像标记阅读机中的识别算法，并提出一种新的信息卡填写方式。对常用的字符识别方法以及特征提取方法进行了描述，并根据实际，采用基于最小距离分类器的模板匹配算法来对手写符号进行识别，结果表明算法能有效地解决信息填涂卡文档图像的手写符号识别问题。相似文献

9.

基于Web的信息过滤机制 总被引：12，自引：0，他引：12

林鸿飞《计算机工程与应用》2002,38(2):190-192

信息过滤目的在于依据用户兴趣进行动态信息搜索以满足用户的需求。文章给出了基于Web的信息过滤机制。它根据用户信息需求,建立公共模板,利用搜索引擎获取信息源;然后利用文档与用户模板的匹配机制,将相关文档推送给用户。在文档结构分析和相关反馈的基础上,提出了特征抽取和权重分配算法;将布尔模型和向量空间模型相结合,提出了文档与用户模板匹配算法。相似文献

10.

面向畸变扭曲文档的两种图像矫正网络

冯瑾池越周亚同何静飞《数据采集与处理》2024,(1):167-180

由于文档纸张的几何形变、拍摄场景的干扰及拍摄角度不理想导致的透视失真,移动设备获取的文档图像的光学字符识别（Optical character recognition,OCR）性能受到很大挑战。针对折叠和扭曲的畸变文档图像预处理问题,设计了两种基于自编码器的网络结构,以实现自适应性图像矫正并提高文字识别正确率。首先提出空洞残差块和非对称卷积残差块两种残差块,然后将残差块与自编码器相结合,设计了一种非对称空洞自编码器网络;同时利用空间金字塔池化代替全连接层,并用非对称卷积残差块实现特征提取,设计了另一种空间金字塔自编码器网络。实验结果表明,与畸变图像相比,经非对称空洞自编码器网络矫正后的图像在OCR正确率、OCR召回率和文本相似度上分别提高了26.3%、20.4%和12.3%,而经空间金字塔自编码器网络矫正后的图像在正确率、召回率和文本相似度上分别提高了27.7%、22.0%和15.5%。与RectiNet等其他图像矫正网络相比,这两种网络可以自适应矫正多种类型的畸变文档图像,且矫正后的图像在文字识别上表现更为优异。本文提出的两种矫正网络能有效提高图像文字识别正确率、召回率和文本相似度,... 相似文献

11.

基于三维边缘重构的文档图像自动矫正方法

刘婀娜刘一斐祁建芳《计算机应用研究》2007,24(7):315-317

针对照相机对装订书籍拍照时由于书面弯曲产生文档图像变形的问题,利用从图像中提取的文档边缘作为特征信息,通过参数控制自动实现文档图像的矫正.与以往研究成果相比,本方法无须人工标记及特殊设备,具有一定的优越性.实验结果能够有效地对变形文档图像进行矫正. 相似文献

12.

DPENet：轻量化文档姿态估计网络

下载免费PDF全文

韩晶吕学强张祥祥郝伟张凯《计算机工程与应用》2022,58(22):210-218

现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题。从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet（lightweight document pose estimation network）,以优化上述问题。将文档图像中的单一文档视为一个姿态估计对象,将文档的四个角点视为文档对象的四个姿态估计点,采用兼具全连接回归与高斯热图回归优点的DSNT（differentiable spatial to numerical transform）模块实现文档图像角点的高精度定位,并通过透视变换处理实现透视变形文档图像的高精度矫正。DPENet采用轻量化设计,以面向移动端的MobileNet V2为主干网络,模型体量只有10.6?MB。在SmartDoc-QA（仅取148张文档图像）数据集上与现有的三种主流网络进行了对比实验,实验结果表明,DPENet的矫正成功率（96.6%）和平均位移误差（mean displacement error,MDE）（1.28个像素）均优于其他三种网络,同时其平均矫正速度也有良好的表现。在保持轻量化和速度快的条件下,DPENet网络具有更高的变形文档矫正成功率和矫正精度。相似文献

13.

一种改进的基于比值模板匹配的显微图像拼接 总被引：3，自引：0，他引：3

方青王博亮《计算机工程》2005,31(24):159-160,230

提出了一种新的基于比值模板匹配的彩色图像拼接算法。通过在比值模板的构造中引入一个自相关属性来增强模板匹配的健壮性,为了保证待拼接图像在色差与亮度上的一致性,对拼接的结果图进行了相关矫正。最后采用渐进渐出的方法来消除拼接缝隙。相似文献

14.

基于机器视觉的淡水鱼外形检测方法

马商牟司胡志刚曾山李皞《计算机应用》2021,41(z2):270-274

为了满足大宗淡水鱼智能加工生产的需要,实现对不锈钢链板上淡水鱼的轮廓检测,提出一种抗畸变性强的轮廓检测方法.该方法由畸变矫正、背景差分、椭圆拟合三部分组成.首先,采集链板上的淡水鱼图像与模板图像,构造待检测图像与标准模板图像对应像素点的投影矩阵,将畸变的待检测图像矫正至统一的坐标系下;然后,与标准模板图像匹配,对感兴趣区域(ROI)差分去除背景,得到目标图像并提取其轮廓点;最后,采用逐步椭圆拟合法,确保鱼身主体部分被精确地拟合,且长轴方向与鱼体方向一致.通过将匹配算法与背景差分法相结合,确保了校准后的待检测图像与标准模板图像的ROI完全重合;再利用逐步舍弃部分轮廓样本点的椭圆拟合法,能较好地避免噪声点的影响,精准地描述淡水鱼轮廓.实验结果表明,相较于传统的背景差分和椭圆拟合算法,所提方法能将误差范围控制在5％以内,大幅提高了检测精度. 相似文献

15.

融合图像显著性与特征点匹配的形变目标跟踪

下载免费PDF全文

杨勇闫钧华井庆丰《中国图象图形学报》2018,23(3):384-398

目的针对目标在跟踪过程中出现剧烈形变,特别是剧烈尺度变化的而导致跟踪失败情况,提出融合图像显著性与特征点匹配的目标跟踪算法。方法首先利用改进的BRISK（binary robust invariant scalable keypoints）特征点检测算法,对视频序列中的初始帧提取特征点,确定跟踪算法中的目标模板和目标模板特征点集合;接着对当前帧进行特征点检测,并与目标模板特征点集合利用FLANN（fast approximate nearest neighbor search library）方法进行匹配得到匹配特征点子集;然后融合匹配特征点和光流特征点确定可靠特征点集;再后基于可靠特征点集和目标模板特征点集计算单应性变换矩阵粗确定目标跟踪框,继而基于LC（local contrast）图像显著性精确定目标跟踪框;最后融合图像显著性和可靠特征点自适应确定目标跟踪框。当连续三帧目标发生剧烈形变时,更新目标模板和目标模板特征点集。结果为了验证算法性能,在OTB2013数据集中挑选出具有形变特性的8个视频序列,共2214帧图像作为实验数据集。在重合度实验中,本文算法能够达到0.567 1的平均重合度,优于当前先进的跟踪算法;在重合度成功率实验中,本文算法也比当前先进的跟踪算法具有更好的跟踪效果。最后利用Vega Prime仿真了无人机快速抵近飞行下目标出现剧烈形变的航拍视频序列,序列中目标的最大形变量超过14,帧间最大形变量达到1.72,实验表明本文算法在该视频序列上具有更好的跟踪效果。本文算法具有较好的实时性,平均帧率48.6帧/s。结论本文算法能够实时准确的跟踪剧烈形变的目标,特别是剧烈尺度变化的目标。相似文献

16.

基于Word和PPT文档图像的信息隐藏

下载免费PDF全文

廖琪男《计算机工程》2010,36(10):163-164

研究Word和PowerPoint文档中图像对象数据的保存机制和获取其完整图像数据的方法,以文档中图像对象作为秘密信息的直接载体,以Word和PowerPoint文档作为二次掩饰体,提出一种基于LSB的图像信息隐藏算法。实验结果表明,与单纯文档文字和数字图像作为信息隐藏载体的算法相比,该算法的隐藏信息量大,隐蔽性和抗干扰性强。相似文献

17.

基于尺度不变局部特征的零低频信息隐藏算法

任帅贺媛柳雨农徐振超张弢王震慕德俊《计算机应用研究》2019,36(11)

针对目前信息隐藏算法抵抗隐写分析能力弱的问题,提出一种基于尺度不变（BRISK）局部特征的零低频信息隐藏算法。首先,对载体图像进行一阶CL多小波变换,在低频◢LL◣▼2▽中提取BRISK特征点生成图像特征矩阵;其次,利用zig-zag和Logistic混沌置乱对秘密信息做去相关性处理;再次,将图像特征与加密信息通过对比特征值形成关联序列;最后,将关联序列嵌入到高频◢HL▼2▽、HH▼2▽◣的低3位。算法将高能量区域的特征矩阵与两次加密信息所构建的关联信息隐藏于高频区域,有利于算法的鲁棒性和抗分析性。在高阶统计量对200幅图片的分析测试下,最大检出率低于7.516%,表明所提算法具有良好的抗分析性。相似文献

18.

基于对称方向滤波的指纹图像二值化 总被引：1，自引：0，他引：1

贾哲李临生田启川张永亮《计算机应用》2008,28(Z1)

提出了一种结合方向信息的背景分割算法,能简单有效地将指纹从背景区域分割出来.还提出了一种对称滤波模板算法,不仅使脊线和谷线清晰分离而且矫正了纹线的方向并使脊线向中心集中,最后使用动态阈值法得到指纹二值化图像.实验表明,该算法对不同质量的指纹图像,能有效地抑制噪声,得到平滑连接的二值图像. 相似文献

19.

基于DCT频域的文档图像水印算法

岳岩王希常《福建电脑》2009,25(5):70-70

DCT域数字水印算法是目前频域算法中的准最佳算法．但目前大多数算法都将水印信号经过一定的变换嵌入到DCT交流分量的中频或低频系数上,本文根据文档图像的具体特点,提出在DCT直流分量上嵌入水印．更好地保证了文档图像的鲁棒性。相似文献

20.

面向可见光—近红外图像融合的植被与天空概率模板生成

下载免费PDF全文

童璨应佳成沈会良《中国图象图形学报》2022,27(12):3516-3529

目的近红外(near-infrared,NIR)图像在夜视和去雾等方面发挥着重要作用,RGB-NIR图像融合是一种常见且有效的处理方式。在实际图像处理过程中,图像的不同对象区域因特性不同需要进行差异化处理,但是现有图像融合算法在植被和天空图像区域存在明显不足。对此,提出RGB-NIR联合图像的植被和天空区域概率模板生成算法。方法以植被为感兴趣区域,基于RGB图像各通道比值和扩展归一化植被指数(normalized difference vegetation index,NDVI)两种特征,提出RGB-NIR联合图像的植被区域概率模板生成算法。以天空为感兴趣区域,基于透射率图引导的局部熵和扩展NDVI两种特征,结合像素高度信息,提出RGB-NIR联合图像的天空区域概率模板生成算法。两种算法生成的植被和天空的概率模板在RGB-NIR图像融合过程中利用概率模板对权重矩阵进行修正,可明显改善融合效果。结果检测植被的模板生成算法与传统NDVI进行比较,在对比度和鲁棒性方面有更大优势;与语义分割进行比较,在准确度和纹理细节上有更好表现。检测天空的模板生成算法与当前的概率模板天空检测算法相比,准确率更高,边缘过渡更平滑;与当前的二值模板天空检测算法相比,在检测效果相当的情况下能保留更多细节信息,并且对小物体的划分更为准确。以本文检测算法修正后的图像融合结果在保持细节增强效果的同时,视觉感观更为自然,在定量指标上也更占优势。结论本文提出的概率模板生成算法结果准确、性能鲁棒,能有效提升RGB-NIR图像融合的效果,特别是在涉及权重的图像融合中能更好地结合与应用。相似文献