共查询到19条相似文献,搜索用时 171 毫秒
1.
基于字线分离的表格识别预处理算法 总被引:1,自引:1,他引:0
表格文本图像版面中存在的大量的非表格框线对象,干扰正确提取表格框架结构.提出了一种基于字线分离的预处理算法.该算法在不提取表格框线的前提下,采用图像分块和连通域分析,实现字线分离.实验结果表明,该算法能够滤除大部分文字像素,准确有效突出表格文本图像中的框线信息,达到了预处理目的,是后续表格特征提取和识别的有效预备步骤. 相似文献
2.
表格型票据中框线检测与去除算法 总被引:1,自引:0,他引:1
字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去除算法,首先充分利用票据灰度图像的特点准确地检测出框线,再采用一种连通链结构描述叠加后的框线区域,然后对交叠进行判断和标记,根据标记保留字符笔划去除框线干扰.经过实际银行支票图像测试证明了算法的有效性和鲁棒性. 相似文献
3.
在版面分析过程中,有时会将表格误判为图形或将图形误判为表格。为避免对误判的表格或图形进行识别而产生的错误结果,文章提出了一种根据表格框线信息和表格单元信息来区分表格与图形的方法。该方法结合表格的结构特征,提出了作为一个表格的重要组成要素的表格框线和表格单元所必须满足的若干约束条件,通过验证每个条件是否得到满足来区分表格与图形。实验表明,该方法能有效地区分绝大多数表格与图形,极大地降低了对表格与图形的误判率。 相似文献
4.
5.
6.
表格分析是对表格的基本结构及形状进行识别的过程,是以后能否从表格单元中正确提取文本信息的关键.在结合表格特点的基础上,采用了表格线检测与处理相结合的方法获取表格框线.检测表格线过程中,通过定义了主表格线长度来加快扫描的速度:在表格线的处理中,针对杂线的剔除、表格线的调整及最终获得表格结构等方面进行了系统的探讨.大量的实验结果表明所提方法是可行的. 相似文献
7.
针对在通过拍照采集图像的过程中由于光照不均而造成的文本图像的噪声问题,研究了文本图像区别于一般图像的结构特征和噪声特征,提出了一种基于文本图像的投影结合分块形态学的快速去噪方法.该方法对输入的文本图像进行二值化,对二值化后的文本图像进行投影处理,根据对投影结果进行分析来快速去除行列间噪声,根据行列间噪声的多少产生一个阈值,通过这个阈值来确定分块后的图像是否需要字符内去噪,字符内去噪则采用形态学滤波法.实验结果证明,该方法对于正常情况下光照不均的文本图像的去噪较传统的全局去噪算法的效率更高,效果更好. 相似文献
8.
基于有向单连通链的表格框线检测算法 总被引:12,自引:0,他引:12
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息.提出了一种基于所定义的图像结构基元"有向单连通链"的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求.实验证明,该算法具有速度 相似文献
9.
10.
11.
目的 青铜器是我国的文化瑰宝,然而出土青铜器大多破损、变形,需要修复以进行保护。随着3维激光扫描技术及数字几何处理研究的发展,文物数字化修复技术得到了广泛的重视。在青铜器修复过程中需要将相邻碎片的纹饰对准,以保证纹饰的连续性,从而保证修复质量。因此,青铜器纹饰特征的有效提取是青铜器修复过程中的一项重要工作,鉴于青铜器纹饰特征一般具有比较明显的尖锐边,本文提出并实现了一种青铜器尖锐特征增强及自动提取算法。方法 首先,为了减少网格均匀度对特征提取的不利影响,提出一种加权法向距离;其次,为了增强尖锐特征提取效果,提出一种逆双边滤波算法,并利用该算法获得反锐化掩膜,增强法向距离间的差异性,使得大的更大,小的更小;最后,采用Otsu算法自动确定分割阈值,依据该阈值把网格顶点分为特征点集和非特征点集,实现青铜器纹饰特征的提取。结果 对实际3维激光扫描获得的青铜器模型,分别采用本文算法和Tran等人提出的尖锐特征自动提取算法进行了纹饰特征提取,包括采用两种算法进行了纹饰特征增强前后纹饰特征提取实验,本文使用的3个模型点数在6 000至80万之间,这些模型都可以在1 s到10 s之间得到最终的提取结果,具有较高的效率。同时,本文算法可以更为准确地提取尖锐特征点,且得到的特征点更为连续,有利于进一步的处理。结论 采用本文提出的青铜器纹饰提取算法,能够自动、高效地提取青铜器纹饰特征。 相似文献
12.
文本是计算机视觉的许多应用中的一项重要特征,图像中的文本往往包含着比较丰富的信息,将文本图像信息里的文字进行提取和识别,对于图像内容的分析、理解、信息检索等方面具有重要的意义。文本图像的识别分为预处理,文字的切分,细化,特征选择与提取,最后对候选文字进行识别。在文字的切分方面提出了一种改进的投影算法,该算法能在很大程度上提高文字切分的准确度,采用基于数学形态学算法对文字进行细化处理,并在特征选择方面引用了多级分类的算法。 相似文献
13.
大数据时代的到来,快速而准确的索引算法对信息检索至关重要。针对基于随机投影构成的单表哈希检索方法导致搜索性能低的问题,提出一种基于主成分的多表图像哈希检索方法。为了得到高效的哈希编码保证不同语义样本特征的区分性,首先通过主元分析方法保留训练集具有区分性图像特征,此外利用特征聚类作为学习哈希投影的指引构建多个索引表;其次采用正交旋转矩阵对哈希投影进行优化,保证了相同语义的样本具有相似的哈希码。最后分别在CIFAR-10和Caltech-256数据集上与相关方法进行比较,实验结果表明提出的方法提高了检索性能。 相似文献
14.
15.
首先将投影方法运用于图像局部子块,并与矢量量化技术相结合,得到投影矢量索引直方图特征,能够有效提取图像的颜色分布、空间关系等信息;其次,提出基于块基元的LBP纹理特征算法,既能有效提取块基元的结构模式,又能避免传统基于单像素LBP模板的不稳定性,并大幅减少了计算量;最后,基于显著图提出了划分显著区域和非显著区域的特征提取方案,使得分别提取的特征更富于视觉意义。实验结果表明,本文算法相对于传统索引直方图方法在性能上有较大的提高,平均查准率平均提高幅度为6.39%。 相似文献
16.
目的 目前对于场景分类问题,由于其内部结构的多样性和复杂性,以及光照和拍摄角度的影响,现有算法大多通过单纯提取特征进行建模,并没有考虑场景图像中事物之间的相互关联,因此,仍然不能达到一个理想的分类效果。本文针对场景分类中存在的重点和难点问题,充分考虑人眼的视觉感知特性,利用显著性检测,并结合传统的视觉词袋模型,提出了一种融合视觉感知特性的场景分类算法。方法 首先,对图像进行多尺度分解,并提取各尺度下的图像特征,接着,检测各尺度下图像的视觉显著区域,最后,将显著区域信息与多尺度特征进行有机融合,构成多尺度融合窗选加权SIFT特征(WSSIFT),对场景进行分类。结果 为了验证本文算法的有效性,该算法在3个标准数据集SE、LS以及IS上进行测试,并与不同方法进行比较,分类准确率提高了约3%~17%。结论 本文提出的融合视觉感知特性的场景分类算法,有效地改善了单纯特征描述的局限性,并提高了图像的整体表达。实验结果表明,该算法对于多个数据集都具有较好的分类效果,适用于场景分析、理解、分类等机器视觉领域。 相似文献
17.
为了能对包含不规则图片区和表格的倾斜文本页面图像进行图文分割与分类,提出了一种新的图文分割和分类算法。该算法先采用数学形态学和分级霍夫变换来进行文本倾斜的检测和校正;然后为了使算法能够对包含不规则图片区的文本页面图像进行处理,提出在传统的投影轮廓切割算法中,引入中点切割的过程,以便利用一系列的矩形来近似地逼近不规则的图片区。对于分割后的图像,则提出利用黑白像素比(Rbw)和近邻像素间的交叉相关性(Rcc)两个特征来作为分类的判据。实验结果证明,算法速度快、可靠性高。该算法只适用于二值图像。 相似文献
18.