期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

神经网络的西夏字识别技术研究 总被引：1，自引：0，他引：1

马希荣王行愚《计算机工程与应用》2001,37(18):10-12

字符识别是模式识别领域的一个传统课题，汉字和古文字的识别是中文信息处理领域的一个重要研究课题，汉字的识别技术有力地推动了计算机技术的广泛应用。本文对西夏文字的特点以及神经网络的西夏字识别技术的每个环节进行了详细的讨论。相似文献

2.

基于细化的西夏字笔划提取方法研究 总被引：1，自引：0，他引：1

马希荣王行愚《计算机工程与应用》2002,38(20):30-31,47

西夏文字字数多、字形复杂、形态相似的字多,受手工书写因素的影响,同一个字的模式变化很大。文章提出了一种西夏字笔划提取方法。相似文献

3.

藏文识别中相似字丁的区分研究 总被引：7，自引：0，他引：7

王维兰丁晓青祁坤钰《中文信息学报》2002,16(4):61-66

相似字丁多是藏文识别中的一大难点。本文通过对相似字丁类型的研究,以及印刷体藏文识别结果的统计分析,得到图形结构的分析与识别结果相吻合的结论。说明必须根据藏文字丁的结构特点,在字符归一化、特征选择方面进行特殊的处理,以实现藏文识别中相似字丁的区分。相似文献

4.

基于汉字字形的西夏文字版面分析方法研究

马希荣王行愚《计算机工程与应用》2002,38(1):45-46,84

基于汉字字形的西夏文字有6000字,西夏字的信息处理有利于西夏学的研究和西夏书籍的出版。在汉字、英文等文字的版面分析已有一些研究成果,古籍的版面分析也是一个研究热点。该文就西夏文的版面分析进行了系统的研究和实践。相似文献

5.

西夏文字识别中的图像预处理 总被引：5，自引：0，他引：5

马希荣王行愚《计算机工程与应用》2002,38(2):48-50

西夏文字的预处理是其识别过程的第一步,它的好坏直接影响西夏文字识别的效果。文章用图像分析及处理技术研究西夏文字的预处理,就西夏文字识别预处理中的每个过程进行了详细的研究,提出的方法和处理技术在实验中收到了良好效果。相似文献

6.

基于西夏古籍文字样本数据库设计与实现

孟一飞杨文慧谢堂健戴雪瑞《电脑与信息技术》2017,25(6)

随着计算机技术的发展和在文字处理方面的应用,逐渐开展西夏文数字化的研究,西夏文的图像分割和识别对开展文物研究以及文献翻译具有非常重要的价值,但制约西夏文识别的关键技术在于西夏文数据库的建立.文章针对西夏文字的特点,设计了针对字符提取和样本数据库建立的具体流程,并讨论了数据库检索的组织和方法.依据连通域标识算法和边缘检测的原理进行字符提取,再将所提取的字符信息储存在我们指定的文本中.最终将所提取到的西夏文字与汉字进行匹配,保存后即完成一个包括西夏文字、汉字、以及它们多对应的序号等信息的样本数据库的创建,数据库的建立对西夏文字的识别提供了测试标准. 相似文献

7.

基于汉字字形的西夏文字信息处理研究

马希荣王行愚《计算机工程与应用》2001,37(21):26-27,95

基于汉字字形的西夏文字有6000字,西夏字的信息处理有利于西夏学的研究和西夏书籍的出版。文章从西夏字的字形存储、曲线轮廓字的形成进行了系统的研究。在西夏字库和汉字库共处同一平台的问题的处理上有独到之处。相似文献

8.

西夏文献图像版面分割与分类算法研究与实现

刘丽晖费向东《计算机光盘软件与应用》2013,(4):49-51

随着世界上西夏学研究的兴起,西夏文献作为西夏文物的重要组成部分越来越受到重视。本文介绍了西夏古籍文献的研究意义、图像处理、分割以及分类等问题。对比分析了西夏文字图像预处理的方法,设计实现了西夏文字图像版面的分割的算法,并分析了采用模版匹配的方式对分割后图像按一定特征分类的算法。分割后的西夏文字更易于辨认研究,且有利于计算机自动进行识别和理解图像,对西夏学的研究有着重要的意义。相似文献

9.

基于神经网络的相似汉字识别的研究 总被引：1，自引：1，他引：0

梁曼君石竹《中文信息学报》1993,7(3):28-34

在计算机文字识别中相似汉字识别是一个难题, 我们对Hopfield人工神经网络加以改进, 提出了一种新的HNN网络模型, 并用它来识别相似字, 取得了良好的效果, 为相似汉字识别探索了一条新路。相似文献

10.

基于弹性网格的西夏文字识别

门光福潘晨柳长青《中文信息学报》2011,25(5):109-114

随着国内外对西夏学研究的不断深入,收藏于世界各地的大批西夏古籍文献通过影印方式陆续出版。如何将这些西夏古籍文献数字化、文本化则有着极其重要的意义。该文采用弹性网格方法及线性判别分析(Linear Discriminant Analysis,LDA)方法对西夏文字识别进行了研究。首先对西夏影印文献进行预处理、细化,然后根据西夏文字笔画分布构造非均匀的弹性网格,将弹性网格分别作用于西夏文字的四个方向分量上,统计像素点在网格内的概率分布作为特征,最后使用LDA方法对提取的特征降维处理。对240类共9 600个西夏文字做4重交叉验证,平均识别率可达87.99%,实验表明该方法是有效的。相似文献

11.

脱机印刷体彝族文字识别系统的原理与实现 总被引：1，自引：0，他引：1

朱宗晓吴显礼《微机发展》2012,(2):85-88,92

脱机印刷体彝文文字识别系统包括字符分割、特征提取、特征压缩以及字典匹配四个主要模块,该系统利用总结出的彝文字符合并和反合并规则提高了字符分割准确率,采用1024维周边方向贡献度作为彝文字符统计特征,对彝文中存在的大量相似字符具有良好的区分能力。系统还采用基于KL变换的特征压缩算法和三级字典快速匹配算法,最终实现了一个基于Windows平台的脱机印刷体彝文识别平台,该平台对样本的一次识别率在99.4%以上。实验结果表明这些方法是可行的和高效的。相似文献

12.

车辆牌照上英文和数字字符的结构特征分析及提取 总被引：31，自引：0，他引：31

下载免费PDF全文

宋加涛刘济林《中国图象图形学报》2002,7(9):945-949

为了研制高性能的车辆牌照自动识别系统，在详细分析车辆牌照上英文和数字字符结构特点的基础上，选择字符图象中的闭合曲线作为其整体特征，将笔画端点，三叉点和四叉点作为其细节特征，同时将笔画中的拐角点作为其辅助结构特征，三者可分别用于字符的粗分类，细分类和相似字符区分，进而提基于图论和细节点特征的闭合曲线检测算法以及基于二值图象外边缘轮廓线的笔画拐角点检测算法，将上述结构特征用于车辆牌照上英文和数字字符识别，测得识别率达96％，用PⅢ550计算机完成结构特征抽取和字符识别所用时间约20ms／字符，表明这些结构特征适用于车辆牌照上英文和数字字符的快速识别。相似文献

13.

On-line handwritten Chinese character recognition via a fuzzy attribute representation

Chen Ju-Wei Lee Suh-Yin 《Image and vision computing》1994,12(10):669-681

Chinese characters are constructed by strokes according to structural rules. Therefore, the geometric configurations of characters are important features for character recognition. In handwritten characters, stroke shapes and their spatial relations may vary to some extent. The attribute value of a structural identification is then a fuzzy quantity rather than a binary quantity. Recognizing these facts, we propose a fuzzy attribute representation (FAR) to describe the structural features of handwritten Chinese characters for an on-line Chinese character recognition (OLCCR) system. With a FAR. a fuzzy attribute graph for each handwritten character is created, and the character recognition process is thus transformed into a simple graph matching problem. This character representation and our proposed recognition method allow us to relax the constraints on stroke order and stroke connection. The graph model provides a generalized character representation that can easily incorporate newly added characters into an OLCCR system with an automatic learning capability. The fuzzy representation can describe the degree of structural deformation in handwritten characters. The character matching algorithm is designed to tolerate structural deformations to some extent. Therefore, even input characters with deformations can be recognized correctly once the reference dictionary of the recognition system has been trained using a few representative learning samples. Experimental results are provided to show the effectiveness of the proposed method. 相似文献

14.

A segmentation-free approach to recognise printed Sinhala script using linear symmetry

H.L. Premaratne Author Vitae J. Bigun^{Author Vitae} 《Pattern recognition》2004,37(10):2081-2089

相似文献

15.

基于小波变换的图像汉字笔划特征提取方法

訾兴建王建平《计算机工程与应用》2012,48(12):168-172

借鉴仿生模式识别的认知观点,从汉字的构造机理和人类认识汉字的习惯角度出发,提出一种基于小波变换的图像汉字识别方法。制定了图像汉字笔划特征提取的具体规则,采用小波变换的方法对图像汉字边缘和笔划轮廓进行检测,通过有效提取图像汉字笔段信息,进行笔段合成,生成汉字或汉字的基本笔划。仿真实验结果表明,这种方法提高了图像汉字笔划特征提取的准确率和稳定性,对于印刷体和书写较规范的手写体图像汉字具有极高的识别率。相似文献

16.

Recognition of hand-printed Chinese characters using decision trees/machine learning C4.5 system

A. Amin S. Singh 《Pattern Analysis & Applications》1998,1(2):130-141

Recognition of Chinese characters has been an area of major interest for many years, and a large number of research papers and reports have already been published in this area. There are several major problems with Chinese character recognition: Chinese characters are distinct and ideographic, the character size is very large and a lot of structurally similar characters exist in the character set. Thus, classification criteria are difficult to generate. This paper presents a new technique for the recognition of hand-printed Chinese characters using the C4.5 machine learning system. Conventional methods have relied on hand-constructed dictionaries which are tedious to construct and difficult to make tolerant to variation in writing styles. The paper discusses Chinese character recognition using theHough transform for feature extraction and C4.5 system. The system was tested with 900 characters written by different writers from poor to acceptable quality (each character has 40 samples) and the rate of recognition obtained was 84%. 相似文献