首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
多编码环境下藏字内码识别算法的研究   总被引:1,自引:0,他引:1  
藏字内码向ISO/IEC 10646-1藏文编码过渡是实现计算机用文字编码统一的必然趋势,但目前在很长的一段时间内仍将存在多种藏字编码并存的情况,所以实现藏字内码的自动识别是保证藏字多内码并存的关键.主要探讨了如何在多内码并存的多编码环境中实现藏字内码自动识别的问题,并提供了两个藏字内码识别算法.在此基础上,对不同的识别算法进行分析和评估.在对目标样本的测试中,以上算法的识别率最高可以达到100%以上.  相似文献   

2.
目前,在计算机中汉字有多种代码页,汉字的多代码页并存现象将长期存在。为了实现汉字多代码页并存,需要汉字代码页自动识别技术的支撑。屏幕实时解释引擎是目前各种在线字典、词典以及教学软件的核心技术,此技术目前存在不能跨代码页,取词不全面、不正确等缺陷。本文主要针对以上情况,描述了采用汉字内码的代码页自动识别技术以及优化的自动屏幕取词技术的中文屏幕实时解释引擎的系统架构,并阐述了数据词典的设计以及在设计中采用的关键技术。对五百万汉字样本的测试中,应用此引擎的在线词典对有意义短字符串(不包括单字) 代码页的识别率可以达到99 %以上。  相似文献   

3.
本文提出了“ 脱壳透视” 的分类原理, 该分类原理对同一汉字集上不同字体的汉字的分类一致性较好, 抗干扰能力强, 是多种印刷体汉字自动识别中较为满意的分类方法。在识别特征的选取上, 我们提出了“ 特征稳定度” 概念, 从这个概念出发, 提取了每个汉字的稳定识别特征和同字异体的公共识别特征, 将每个汉字的复杂结构抽象成一个具有典型特征的框架模型(简称“ 稳定框架原理” )有效地提高了识别率, 压缩了存储空间。根据这些原理, 我们以OKIFAX7700传真机作扫描器, 在CROMEMCO SYSTEM THREE上实现了对GB2312一级字3755个四号宋体及黑体汉字98.57%的识别率及3.24字/秒的识别速度。  相似文献   

4.
汉字化是NLS(National Language Support)潮流中的重要组成部分。汉字化的中心任务是以汉字内码为基础, 树立汉字数据类型。本文提出了理想汉字内码的若干特征, 并以此为基础,对主要的实用汉子的内码进行了分析比较, 进而阐明了汉字内码与汉字数据类型的区别与联系, 指出了汉字数据类型与相应操作的匹配问题。 作者认为汉字内码的研究与规范化是当前汉字化的瓶颈问题和信息系统建立的当务之急。  相似文献   

5.
问;什么是汉字识别? 答:汉字识别是一种自动的计算机汉字输入技术,是中文信息处理、办公自动化的重要组成部分。它通过扫描、摄像的方式,或者通过实时采集书写的轨迹,由计算机将文稿或书写轨迹自动识别为相应的汉字内码。这种技术可以使人们不使用任何汉字编码方式(比如五笔字型),就能把汉字输入计算机里去。 汉字识别分为联机识别和脱机识别。联机识别(或称手写输入)是将汉字在一块与计算机相连的手写板或数字化仪上,计算机实时采集  相似文献   

6.
汉字信息处理领域中急待解决汉字自动阅读技术的开发。在实现结构分析法识别多字体印刷汉字时, 笔划抽取是关健所在。本文提出了从汉字点阵中直接抽取笔划特征的新算法, 省去了细化过程。与国外同类研究相比, 处理速度和正确率均有较大提高。对国标一级汉字的抽取结果是令人满意的。  相似文献   

7.
本文对银行的票据自动识别技术及其进展进行了论述。主要是票据自动识别系统的构建,包括扫描输入模块和识别模块。介绍OCR在票据自动识别系统中的应用,介绍一些最新票据识别算法,主要是通用票据识别系统中的字符切分方法、基于特征线检取的票据识别算法和滴水算法。  相似文献   

8.
本文提出的内码转换的基本思想是:将每一个汉字内码从整体上着作一个特殊进制数。这样,不同内码的转换便可以用不同数制之间的转换方法来实现。此种方法适用于多种版本的汉字内码转换。对于异型机联网以及其它汉字信息交换具有参考意义。  相似文献   

9.
本文介绍了unix操作系统下由于终端汉字内码设置问题赞成汉字不能正确识别的解决方法。  相似文献   

10.
一种新的地形图汉字注记自动提取算法   总被引:5,自引:0,他引:5  
地形图中包含大量的汉字注记,为了实现地图要素自动识别,首先要将文字正确地提取出来。该文通过对汉字特征的分析,提出了一种新的汉字提取算法。首先根据地图图像的特点进行骨架运算,利用形态算子对汉字笔画进行分解,最后实现对汉字注记的笔画统计提取。该算法较好地解决了字线粘连、旋转等情况下的汉字提取问题,具有良好的稳定性。  相似文献   

11.
汉字识别属于大类别模式识别问题,用并行算法可望提高在单机环境下识别离线手写汉字图象的运行速度,提出了一种汉字识别算法的并行设计方案,并针对它在PVM环境下运行结果进行了性能分析。  相似文献   

12.
研究了现阶段无人机雷达探测技术的难点与方法,分析了量子多模式识别网络模型与算法,根据Grover算法优化理论,提出了基于相位旋转的量子多模式识别算法(PRQMPRA)。优化算法避免了在带冗余项的量子多模式识别算法(RQMPRA)中两个相位旋转均为[π]会导致搜索成功概率降低的缺陷。利用三种数据集对误差反向传播算法(EBPA)、基于交叉熵函数的深层自编码器学习算法(CDAA)以及RQMPRA与PRQMPRA进行模式识别能力分析,结果表明在确定限定误差的情况下PRQMPRA具有更高的识别率与相对较快的运算速度。提出了一种基于量子多模式识别算法的雷达目标检测方法,通过模式分类的方法研究目标检测问题。利用上述四种算法进行无人机目标检测实验,研究结果表明PRQMPRA具有更高的检测精度,在低信噪比的情况下可保持较高的发现概率。  相似文献   

13.
光字符识别对人类是很简单的,但对计算机来说显得非常困难。自动字符识别在银行、航运、商业、通信、车牌识别等重要领域应用相当广泛。该文的主要任务是开发一个能识别机器印刷英文字符的系统,该系统采用基于反向传播的多层神经网络监督训练算法。通过系统进行多次测试和调试,不断优化网络参数并取得最佳结果,使得构建的新系统能够识别多种字体的字符。实验结果表明,该系统具有较高的识别率和优越的性能。  相似文献   

14.
15.
Emotion recognition plays an effective and important role in Human-Computer Interaction (HCI). Recently, various approaches to emotion recognition have been proposed in the literature, but they do not provide a powerful approach to recognize emotions from Partially Occluded Facial Images.In this paper, we propose a new method for Emotion Recognition from Facial Expression using Fuzzy Inference System (FIS). This novel method is even able to recognize emotions from Partially Occluded Facial Images. Moreover, this research describes new algorithms for facial feature extraction that demonstrate satisfactory performance and precision. In addition, one of the main factors that have an important influence on the final precision of fuzzy inference systems is the membership function parameters. Therefore, we use a Genetic Algorithm for parameter-tuning of the membership functions. Experimental results report an average precision rate of 93.96% for Emotion Recognition of six basic emotions, which is so promising.  相似文献   

16.
汽车牌照识别是图像识别领域的重要研究课题,提出一种基于Matlab的车牌识别系统有效解决了在自然背景下,车辆牌照的定位和字符识别的问题。实践验证,该系统在车牌识别方面效果明显。  相似文献   

17.
脱机手写体汉字识别综述   总被引:4,自引:1,他引:3       下载免费PDF全文
何志国  曹玉东 《计算机工程》2008,34(15):201-204
脱机手写体汉字识别是模式识别领域中的难题之一。该文分析影响脱机手写体汉字识别性能的主要方面,如规范化方法、特征提取方法及分类方法,给出了每种方法的适用条件,介绍了目前研究中所使用的数据库。  相似文献   

18.
本文实现了一个基于综合匹配法的汉字识别后处理系统,该方法既利用了帝级识别结果的信息,又利用了汉语中字的上下文制约关系,即组字成词的信息,同时用了词的使用频度。  相似文献   

19.
基于DSP的中文电子阅读器系统   总被引:1,自引:0,他引:1  
本文介绍便携式的中文电子阅读器系统,采用DSP控制.电路简单,可靠性高,应用灵活,而且可以根据需要容易对系统进行扩展,是汉字识别、发声新的发展途径之一。  相似文献   

20.
基于BP神经网络的印刷字符识别系统   总被引:1,自引:0,他引:1  
光字符识别对人类是很简单的,但对计算机来说显得非常困难。自动字符识别在银行、航运、商业、通信、车牌识别等重要领域应用相当广泛。该文的主要任务是开发一个能识别机器印刷英文字符的系统,该系统采用基于反向传播的多层神经网络监督训练算法。通过系统进行多次测试和调试,不断优化网络参数并取得最佳结果,使得构建的新系统能够识别多种字体的字符。实验结果表明,该系统具有较高的识别率和优越的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号