首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
一个基于骨架汉字技术的字形设计与显示系统SCCDS   总被引:2,自引:0,他引:2       下载免费PDF全文
介绍了一个基于骨架汉字技术的字形设计与显示系统SCCDS。利用骨架汉字数据结构的灵活性, 该系 统能方便地进行字形的交互输入和修改。  相似文献   

2.
本文介绍了采用综合技术集成的方法,解决印刷汉字识别系统误识率太高的重大难题,并通过集成系统的实践,证实了其技术集成优势,由于识别方法的互补效应,不仅提高了识别的正确率,而且使误识率得到大幅度的降低,采用该集成办法研制的系统,经过100万字的实际文章的测试,系统的识别率超过98%,误识率小于0.2%,尤其是汉字的误识率小于0.1%。  相似文献   

3.
A new method for recognizing Chinese characters is proposed. It is based on the so-called featurepoints of Chinese characters. The feature points we use include those on the stroke of a character, i.e., endpoints, turning points, fork points and cross points, and the key points on the background of character. Thismethod differs from the previous ones for it combines the feature points on stroke with those on back-ground and it uses feature points to recognize Chinese characters directly. A Chinese character recognitionsystem based on top-down dynamical matching of feature point is developed. The system can recognizenot only 6763 printed sample Song font Chinese characters of size 5.6×5.6mm~2 with high recognition rate,but also the general printed books, magazines and documents with a satisfactory recognition rate andspeed.  相似文献   

4.
研究了基于打印字符图像分析的计算机打印文件检验,以快速鉴别生成打印文件的源打印机.鉴别过程包括打印文件图像采集、图像预处理、特征提取和匹配.用自行设计的装置采集打印文件图像,经过打印字符提取和识别,利用距离变换和方向直方图方法对不同打印文件中的相同字符进行匹配,来进行打印文件的源打印机认定.在有40台激光打印机的数据库中测试,打印文件鉴别实验准确率达到89.51%,证明了本方法的有效性.  相似文献   

5.
多字体多字号印刷汉字识别方法的研究   总被引:2,自引:0,他引:2  
本文对多体多字号印别汉字识别的方法进行了研究, 本文提出的方法是首先对不同字号印刷 汉字进行归一化处理, 再抽取汉字四周笔端数特征、改进粗外围特征、笔划穿插次数特征和投影变换特征, 然后对组合特征进行多级分类识别。实验在IBM一PC AT 微型机上进行, 结果表明, 实验系统在识别实际印别文本时识别率大于98%。  相似文献   

6.
针对彩色印刷图像背景色彩丰富和汉字存在多个连通分量,连通域文字分割算法不能精确提取文字,提出基于汉字连通分量的彩色印刷图像版面分割方法。利用金字塔变换逆半调算法对图像进行预处理,通过颜色采样和均值偏移分割图像颜色,标记文字连通分量,根据汉字结构和连通分量特性重建汉字连通分量,分析文字连通分量连接关系确定文字排列方向实现文字分割。实验结果表明,该方法能够有效地重建汉字连通分量,在彩色印刷图像中实现对不同字体、字号、颜色的文字分割。  相似文献   

7.
A method is described to extract an index from a binary character image for database storage and retrieval. The index is hierarchical in nature, and different parts can retrieve character image clusters of different sizes. A hierarchy of Kohonen neural networks is used to generate the clusters on which the indexing method is based. The application is the identification of the font from a sample of printed characters. This is particularly important for forensic document examiners who may have to match a document of unknown origin with the equipment that may have produced it. A computerised system is expected to considerably reduce the time required for each document search.  相似文献   

8.
汉字数学表达式开发平台的设计与实现   总被引:1,自引:0,他引:1  
汉字数学表达式理论弥补了汉字内码中包含信息量不足的缺点,使计算机以比汉字更细粒度的汉字部件为基本单元来处理汉字成为可能;基于汉字数学表达式原理,设计并实现了汉字数学表达式开发平台;该平台可以应用在很多领域,作为一个应用实例,开发了一个基于汉字数学表达式平台的文本数字水印系统。  相似文献   

9.
基于流形学习的单字符字体辨别   总被引:1,自引:1,他引:0       下载免费PDF全文
文字种类识别及字体辨别已成为继印刷体文字识别以后新的国内外研究的热点,关于单字的手写体和印刷体辨别的研究不多,但在表单中却极为常用。对于字体辨别问题,引入流形学习算法局部线性嵌套(LLE),假定数据为存在于嵌入高维空间的一个低维流形。提出了用于单字字体辨别的LLE泛化方法及邻域和内在维数的参数估计方法,基于印刷体/手写体汉字字符及数字的辨别实验表明,其性能优于直接支持向量机(SVM)分类,且经过LLE降维后的数据直接用线性判别分析方法(LDA)分类可以获得与LLE计算后SVM分类相近甚至更高的正确率和更快的分类速度。  相似文献   

10.
中英文混合文章识别问题   总被引:11,自引:0,他引:11  
王恺  王庆人 《软件学报》2005,16(5):786-798
当前,已经有大量为单一字符集(或语种)而设计的OCR(optical character recognition)分类器.同时,随着全球一体化,多语文档的出现越来越普遍.因此,设计多语文档处理系统势在必行.提出了一般性的解决方案:两项OCR技术、一个系统和语言判断.为了使研究工作具体化,实现了一个中英文混合文章处理系统.其中主要涉及了3个关键问题:系统流程控制、汉英语言区域分离和英文字符切分.与以往的系统相比,该系统增加了汉英语言区域分离模块,并将基于等间距性的新方法应用于该模块.为了验证本系统的有效性,综合以往的方法实现了另一个系统.实验结果表明,该系统的性能明显优于另一个系统,在杂志样和书籍样上的识别率分别从98.48%和98.68%提高到99.13%和99.25%.  相似文献   

11.
This article introduces the topic of automated visual inspection (AVI) as a subset of machine vision. The components of a generic AVI system will be presented and current applications of AVI systems will be discussed. Specifically, the applications of automated dimension verification, bare printed circuit board inspection, stuffed printed circuit board inspection and component identification using color technology will be covered in some detail.  相似文献   

12.
本文介绍了一个印刷表格文本分析识别系统。提出了表格特征点分析方法。在表格图象处理的基础上, 对表格线进行分析, 在考虑表格线和字符块粘连的情况下提取字符块, 判别汉字串和数英串后分别识别, 生成表格。实验表明本方法的有效性。  相似文献   

13.
本文提出了一种对汉字作任意倍率放缩的算法。该算法先对印刷体汉字作细线化处理,抽取笔划特征点。然后,分割和提取笔划。任意倍率汉字生成是通过变换函数。改变特征点位置,再附加原探察到的笔划修饰来实现的。实验表明本算法是有效的。  相似文献   

14.
如何对急速增长的文档图像进行有效检索是文档图像管理系统的关键技术之一。提出了一种不需要识别文字的检索中文文档图像的方法,该方法在字符分割基础上采用基于粗外围特征粗匹配和基于改进Hausdorff距离相似度测量的两级匹配方法,以适应于时间、准确性的不同要求。同时用对200幅文档图像样本进行了实验,其结果表明,使用该方法对检索印刷体汉字的文档图像具有较高的检索效果,对于数字图书馆中文档图像检索系统的设计,有一定的参考价值。  相似文献   

15.
16.
大规模逻辑神经网络印刷体汉字识别系统   总被引:1,自引:0,他引:1  
逻辑神经网络是一种采用快速学习算法、RAM阵列实现的数字网络。本文描述了采用这种网络模型实现的印刷体汉字识别系统。这是一个初步实用的系统,可识别大约4000个不同字号的宋体汉字及其它字符,其识别率为99%,对于实际书刊,识别率也能达到95%。系统使用了大约384,000个神经节点,是一个复杂的大规模神经网络。和其它同类系统相比,具有适应性、稳固性好,学习速度快以及可用数字集成电路全硬件并行实现等优  相似文献   

17.
文档识别中误切分字符拒识问题的研究   总被引:4,自引:1,他引:4  
自动文档识别中字切分算法如果仅仅依靠大小位置等度量信息,很容易产生误切分图像块,需要字符分类器给出一定的反馈才能准确切分,为此提出了一个新的拒识算法,目标是尽可能准确地拒识非法字符。该文分析了基于距离的分类器的置信度和广义置信度,在此基础上改进了常用的广义置信度映射函数,并设计了一个基于样本学习的拒识规则,提高了拒识算法的适应性。在中日韩三种文档样本上的实验表明,该文算法明显改善了系统性能,对于较低质量的印刷文本识别具有一定的普遍意义。  相似文献   

18.
19.
姚放吾  杨国庆 《计算机工程》1999,25(6):17-18,32
介绍由16位CPU,动态RAM阵列,训练分类等逻辑组成的印刷体汉字识别部件的设计原理和管理软件。  相似文献   

20.
脱机印刷体彝族文字识别系统的原理与实现   总被引:1,自引:0,他引:1  
朱宗晓  吴显礼 《微机发展》2012,(2):85-88,92
脱机印刷体彝文文字识别系统包括字符分割、特征提取、特征压缩以及字典匹配四个主要模块,该系统利用总结出的彝文字符合并和反合并规则提高了字符分割准确率,采用1024维周边方向贡献度作为彝文字符统计特征,对彝文中存在的大量相似字符具有良好的区分能力。系统还采用基于KL变换的特征压缩算法和三级字典快速匹配算法,最终实现了一个基于Windows平台的脱机印刷体彝文识别平台,该平台对样本的一次识别率在99.4%以上。实验结果表明这些方法是可行的和高效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号