首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 156 毫秒
1.
针对传真图像,为了提高版面分割与分类准确率,提高处理速度,以连通区域为处理元素,通过合理设定阈值,将水平和垂直相邻连通区域进行合并,快速准确地分割图像。并且将版面分割过程与分类过程相结合,根据连通区域的大小建立矩阵,提取能够表征区域信息的八维特征,然后使用BP神经网络将版面区域分为文字区域和非文字区域两类。实验中得到版面分割准确率为89.2%,版面分类准确率为94.22%。实验结果证明,该算法能够快速准确地对传真图像进行分割和分类,具有较强的实用价值。  相似文献   

2.
汉字识别系统中的版面分析算法   总被引:2,自引:0,他引:2  
本文在简要介绍版面分析技术发展状况和常见版面分析技术路线的基础上,提出了一种将“自底向上”与“自顶向下”分析路线相结合的版面分析算法。  相似文献   

3.
一种单色表格快速版面分析方法   总被引:3,自引:0,他引:3  
彭健  汪同庆  居琰  叶俊勇  杨波  任莉 《计算机工程》2002,28(11):212-214
结合某铁路分局车辆段列车轮轴卡片自动录入及管理系统开发的实际,提出了一种单色表格的快速分析方法,其主要内容是:利用Radon变换检测表格的歪斜角度将其校正,用投影法找出表格线的位置,根据表格线的位置将待分割的栏目的图像提取出来,该方法具有实用性较强,对表格设计和印刷的要求较低的特点。  相似文献   

4.
基于组件的中文版面分析   总被引:5,自引:1,他引:4  
本文提出基于组件的中文版面分析方法。本方法是以自底向上为主,同时结合了自顶向下和基于组件的思想。基于组件的思想使得算法结构清晰、图象扫描次数被尽可能地减少;以自底向上为主、同时结合自顶向下的方法具有效率高、准确性高、文档适应性广的特点。二维有序树型结构的文档及其组件的组织形式,提高了频繁的查找操作速度,同时为版面描述和分析结果的应用提供了方便。  相似文献   

5.
版面分割是版面分析的重要组成部分,经过大量的研究,如今已到了一个比较成熟的阶段。对基于连通域的版面分割算法进行了改进,能有效快速地分割较为复杂的版面图像,同时有效减少原有算法中阈值引起的分割错误的情况。先对文本图像进行单个字体的区域扩充,使后续的连通间距统计更为准确和方便,再通过连通间距的统计对图像进行模糊整合,进行文本图像的连通区域分割。实验结果表明,改进的基于连通域的算法分割版面准确,速度快,适用范围广,对于较为复杂的版面分割更具有优越性。  相似文献   

6.
徐兆军  业宁  王厚立 《计算机应用》2004,24(Z2):274-275
分析了传统的版面分析算法,提出了一种新的基于神经网络的版面分析的算法.算法先对原图像进行边界识别,以突出文字区域的信息,消弱图像区域的信息,然后用8×8的矩形采样,取样本的期望和方差来作为训练的样本,然后识别,并用基于连通数来滤波.通过实验结果可以看出这种方法是很有效的.  相似文献   

7.
民主选举过程中选票的统计是一项严肃而繁琐的工作,传统的手工操作方法不仅效率低,而且在统计过程中很容易出错,影响了选举工作的进度及质量。选票信息的自动处理能提高录入速度、准确率和公正性。选票信息自动处理的核心是选票版面结构获取和填写信息识别。该文提出了一种基于边框线的选票版面分析方法,并采用OCR(OpticalCharacterRecognition)识别填写信息,该方法具有对选票的设计更方便灵活、纸张和填写的要求低、精度高、通用性好的特点。  相似文献   

8.
《四库全书》是中文古籍的经典和代表。对《四库全书》的整理,可以为其它古籍的整理积累和提供经验。本系统属于《四库全书》电子版专用OCR系统的预处理配套系统,主要功能是对《四库全书》的页面图象进行分析和理解,分离图象中的汉字用于识别和统计,获取版面结构以便于重编和出版。《四库全书》属于手写木版印刷,版面有一定规范,但形式多样、结构复杂、图象质量和字体大小有差异,版面分析的难度很大。本系统采用了自顶向下方法与自底向上方法相结合、自动处理与人工修正相结合的设计思想。从实用情况看,本系统已经能够自动采用相应算法,处理多种规范和准规范的版面,并提供方便的人工辅助纠错功能,保障了预处理工作的顺利进行,也为识别系统的学习建库和识别创造了良好的条件。  相似文献   

9.
一种基于连通域的版面分割方法   总被引:4,自引:0,他引:4  
版面分割是版面分析的重要组成部分,是一个受到广泛关注的研究课题。该文提出了一种基于连通域的版面分割算法,首先对文档图像进行倾斜校正,然后采用模糊处理以得到较大的连通单元,再根据区域连通的特性进行版面分割和处理。实验表明,基于连通域的算法分割版面准确,速度快,适用范围广,不仅可用于矩形版面,对于非Manhattan版面等复杂版面也能取得令人满意的效果。  相似文献   

10.
RTF文件格式在文档版面重构中的应用   总被引:3,自引:1,他引:3  
王宇 《计算机应用》2002,22(12):74-75,79
文档版面重构是文字识别系统中的重要组成部分,它在电子出版等领域有着特殊意义。RTF格式是一种可编程的通用文本、图像信息交换格式。本文介绍利用RTF格式实现文档版面重构,特别是表格重构的方法。  相似文献   

11.
基于连通域的模板匹配法用于字符识别的算法研究   总被引:7,自引:0,他引:7  
文章介绍了一种用于字符识别的基于连通域的模板匹配算法.该算法是在传统的模板匹配法的基础上,运用了重心重叠等处理方法,并且对字符块进行连通域处理后再实施匹配,最后利用最大相似法得出识别结果.该算法在光学仪器读数图象的动态识别中取得了良好的识别效果.  相似文献   

12.
论文提出了基于数学形态学的版面分析方法。该方法是以自底向上为主,同时结合了数学形态学的思想。论文提出的方法,利用数学形态学的膨胀运算和搜索算法,实现对复杂版面进行快速准确的分析。论文以名片版面图像作为测试样本,进行版面分析,取得了预期的效果。  相似文献   

13.
表格文档在日常生活中运用十分广泛,对这类文档进行计算机自动处理能提高文档处理速度和准确度,具有重要的现实意义.表格文档版面结构提取是文档信息处理自动化的核心.由于表格文档图像包含印刷体和手写体字符、图像、污损、噪声和一定的倾斜,在其影响下,正确的提取文档的版面结构是比较困难的.在总结国内外表格文档版面结构提取方法的基础上,提出了一种基于最优坐标系的版面结构提取方法,该方法与其它方法相比具有很强的抗干扰能力和文档版面定义灵活方便的特点.  相似文献   

14.
介绍了独立分量分析(ICA)的基本原理和算法,并提出了基于独立分量分析的特征子空间的目标识别方法。该方法首先利用快速独立分量分析(FastICA)算法对训练集目标图像进行ICA分解,据此建立特征子空间,然后根据待识别图像在特征子空间的投影系数进行判别。本文的改进在于根据类内类间距离比值最小化准则进行最有利于分类的特征的优化选择。实验结果显示,和传统方法相比,改进的方法能有效提高识别的准确率和效率。  相似文献   

15.
以往的山水画计算机仿真由于未从山水画整体布局的角度进行研究,难以实现完整的画作生成.针对上述问题,文中提出布局引导、可实现完整画作生成的中国山水画仿真方法.基于山水画的绘制特点设计可行的布局标签图结构,用于表达山水画的构图形态和要素.借鉴条件生成对抗网络(CGAN)的思想,针对山水画的布局和笔触特点,设计并训练多尺度特征融合的网络结构(MSFF-CGAN),实现布局标签图到仿真山水画这一异质生成过程.同时针对网络训练过程中布局标签图数据稀缺的问题,采用语义关联的颜色像素聚类算法快速生成标签图.为了提高生成图的艺术真实感,引入MemNet超分辨网络增强生成图的纹理细节.实验表明,文中方法生成的仿真山水画具有较好的完整性和艺术真实感,不仅可以应对简单的手绘涂鸦式草图,还可以通过在布局空间的编辑操作,达到对画作空间进行编辑的效果.  相似文献   

16.
In this paper, a visual similarity based document layout analysis (DLA) scheme is proposed, which by using clustering strategy can adaptively deal with documents in different languages, with different layout structures and skew angles. Aiming at a robust and adaptive DLA approach, the authors first manage to find a set of representative filters and statistics to characterize typical texture patterns in document images, which is through a visual similarity testing process. Texture features are then extracted from these filters and passed into a dynamic clustering procedure, which is called visual similarity clustering. Finally, text contents are located from the clustered results. Benefit from this scheme, the algorithm demonstrates strong robustness and adaptability in a wide variety of documents, which previous traditional DLA approaches do not possess.  相似文献   

17.
基于汉字字形的西夏文字有6000字,西夏字的信息处理有利于西夏学的研究和西夏书籍的出版。在汉字、英文等文字的版面分析已有一些研究成果,古籍的版面分析也是一个研究热点。该文就西夏文的版面分析进行了系统的研究和实践。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号