排序方式: 共有3条查询结果,搜索用时 0 毫秒
1
1.
2.
字线交叠是表格处理中经常遇到的问题,它严重干扰了字符识别.本文提出一种基于线宽信息的表格框线去除算法-线宽阈值法.字符内采用较小的阈值去除框线,字符间采用较大的阈值,使本方法具有很好的抗噪声能力.针对数字与框线交叠的特殊情况,本文提出并比较了两种利用先验知识的方法:启发式先验知识法和识别反馈法.增值税发票的识别实验结果表明,本算法能使字线交叠情况下数字的识别率与字线不交叠的情况相当. 相似文献
3.
基于有向单连通链的表格框线检测算法 总被引:12,自引:0,他引:12
表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息.提出了一种基于所定义的图像结构基元"有向单连通链"的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求.实验证明,该算法具有速度 相似文献
1