首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到14条相似文献,搜索用时 78 毫秒
1.
基于汉字字形的西夏文字有6000字,西夏字的信息处理有利于西夏学的研究和西夏书籍的出版。文章从西夏字的字形存储、曲线轮廓字的形成进行了系统的研究。在西夏字库和汉字库共处同一平台的问题的处理上有独到之处。  相似文献   

2.
西夏文字特征提取的研究   总被引:2,自引:0,他引:2  
字符的识别研究已取得了许多研究成果。西夏字的识别研究尚属一个待开发的新领域。西夏字识别的主要问题有:它属于表意文字,还是一个大字符集,具有极高的相似度(有许多结构相似的西夏字在西夏字符集中)。西夏文字的特征提取是整个西夏文字识别系统中最重要的一部分。该文针对西夏文字的特点,提出了能充分反映西夏文字特点的几种特征并加以提取;用这些特征可以有效地识别西夏字。  相似文献   

3.
基于汉字字形的西夏文字有6000字,西夏字的信息处理有利于西夏学的研究和西夏书籍的出版。在汉字、英文等文字的版面分析已有一些研究成果,古籍的版面分析也是一个研究热点。该文就西夏文的版面分析进行了系统的研究和实践。  相似文献   

4.
随着国内外对西夏研究的不断深入,收藏于世界各地的大批西夏古籍文献通过影印方式陆续出版。如何将这些西夏古籍文献进行数字化、文本化则有着极其重要的意义。首先利用平滑和细化算法对西夏影印文献进行了预处理,然后利用Level set方法对影印文献中的西夏字进行了轮廓提取。Level Set演化函数在空间方向上采用了四阶紧致差分逼近式离散,计算过程中加入了窄带算法及全局优化方法。实验表明,算法在不增加计算时间的基础上可以得到较精确的西夏字轮廓。  相似文献   

5.
神经网络的西夏字识别技术研究   总被引:1,自引:0,他引:1  
字符识别是模式识别领域的一个传统课题,汉字和古文字的识别是中文信息处理领域的一个重要研究课题,汉字的识别技术有力地推动了计算机技术的广泛应用。本文对西夏文字的特点以及神经网络的西夏字识别技术的每个环节进行了详细的讨论。  相似文献   

6.
随着计算机技术的发展和在文字处理方面的应用,逐渐开展西夏文数字化的研究,西夏文的图像分割和识别对开展文物研究以及文献翻译具有非常重要的价值,但制约西夏文识别的关键技术在于西夏文数据库的建立.文章针对西夏文字的特点,设计了针对字符提取和样本数据库建立的具体流程,并讨论了数据库检索的组织和方法.依据连通域标识算法和边缘检测的原理进行字符提取,再将所提取的字符信息储存在我们指定的文本中.最终将所提取到的西夏文字与汉字进行匹配,保存后即完成一个包括西夏文字、汉字、以及它们多对应的序号等信息的样本数据库的创建,数据库的建立对西夏文字的识别提供了测试标准.  相似文献   

7.
随着世界上西夏学研究的兴起,西夏文献作为西夏文物的重要组成部分越来越受到重视。本文介绍了西夏古籍文献的研究意义、图像处理、分割以及分类等问题。对比分析了西夏文字图像预处理的方法,设计实现了西夏文字图像版面的分割的算法,并分析了采用模版匹配的方式对分割后图像按一定特征分类的算法。分割后的西夏文字更易于辨认研究,且有利于计算机自动进行识别和理解图像,对西夏学的研究有着重要的意义。  相似文献   

8.
随着国内外对西夏学研究的不断深入,收藏于世界各地的大批西夏古籍文献通过影印方式陆续出版。如何将这些西夏古籍文献数字化、文本化则有着极其重要的意义。该文采用弹性网格方法及线性判别分析(Linear Discriminant Analysis,LDA)方法对西夏文字识别进行了研究。首先对西夏影印文献进行预处理、细化,然后根据西夏文字笔画分布构造非均匀的弹性网格,将弹性网格分别作用于西夏文字的四个方向分量上,统计像素点在网格内的概率分布作为特征,最后使用LDA方法对提取的特征降维处理。对240类共9 600个西夏文字做4重交叉验证,平均识别率可达87.99%,实验表明该方法是有效的。  相似文献   

9.
西夏文字识别中的图像预处理   总被引:5,自引:0,他引:5  
西夏文字的预处理是其识别过程的第一步,它的好坏直接影响西夏文字识别的效果。文章用图像分析及处理技术研究西夏文字的预处理,就西夏文字识别预处理中的每个过程进行了详细的研究,提出的方法和处理技术在实验中收到了良好效果。  相似文献   

10.
封雷 《电脑迷》2010,(17):86-87
看了这个介绍,想必大家能猜出他是谁了吧?他就是一代枭雄.我的偶像——成吉思汗大哥。作为蒙古帝国的一把手.他一直是我崇拜的偶像.模仿的楷模。从十三翼之战开始,到灭花刺子模,以及出征西夏,最后统一蒙古,铁木真哥都淋漓尽致地展现了两个字——爷们!对于一心想成为纯爷们的我来说,《成吉思汗2》的封测就是在告诉我,机会来啦!  相似文献   

11.
袁梅林  张雷 《直通VIP》2007,(2):39-49
时间回朔到1908年4月的一个黄昏。中国西北部巴丹吉林沙漠的深处出现了一支来自境外的骆驼队,领头的是一名叫科兹洛夫的俄罗斯海军中校。这群人也许没有料到他们将发掘一个震惊世界的发现,这一发现被公认为是继十九世纪末、二十世纪初殷墟甲骨、敦煌遗书之後的中国第三大考古文献发现。他们将一个尘封已久的古老王朝重新带回人间。  相似文献   

12.
方块苗文是民间苗文的代表,其信息处理研究对于保护民间苗族文化遗产和弘扬苗族文化有着重要意义。字库开发是方块苗文信息处理研究内容的重要部分。根据方块苗文字库开发的实际需要,该文以文字结构分析为基础,提出了基于Unicode标准的方块苗文编码方案设计思想,介绍了方块苗文字符字模制作的基本步骤,并以标签定义、操作符定义和变换规则定义为重点,探讨了基于OpenType技术的方块苗文字库设计和开发的方法。测试结果表明,方块苗文OpenType字库具有文件小、易扩充等优点,能够解决英文、汉字和方块苗文的混排问题。  相似文献   

13.
孟杰  伯绍波  苏诗琳 《微计算机信息》2007,23(25):254-255,188
本文提出了一种基于灰度图像的车牌字符提取算法,该算法利用Canny算子提取车牌灰度图像中的字符。车牌字符提取后,采用迭代分割法求出最佳阈值对图像进行阈值化处理,结合形态学方法填充字符中的空隙。在VisualC++6.0编程环境下进行了算法实现,实验结果表明,与传统的字符提取算法相比,该算法不仅具有较强的字符提取能力,明显降低噪声对检测结果的影响,而且字符边缘的连接较好,为后期车牌字符的识别提供了技术基础。  相似文献   

14.
无法直接输入计算机或现有的计算机系统字库没有的汉字称为生僻汉字或特殊字。对字库中已包含的生僻汉字,基于造字机理的皮氏输入法可以无重码输入GB18030-2005包括的70244个汉字。对字库中没有的汉字,按照智能造字原理,按照汉字结构和基元进行输入,并生成汉字图片。然后采用插件技术,将生僻字的图片插入到Microsoft Word文档中,以达到输入生僻汉字的目的,为在Microsoft Word文档中完全输入所有的汉字提供了一种方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号