首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于笔划特征的单字符汉字字体识别   总被引:1,自引:0,他引:1  
在文档电子化的文本自动分析、理解和识别过程中,除了有关文档内容的字符识别外,还必须解决字体识别问题.字体识别不仅是版面分析、理解和恢复的重要依据,还有助于实现高性能字符识别系统.有别于目前基于多个字符组成的文本块的字体识别方法,本文提出了一种基于单个汉字字符的字体识别方法.在单个汉字字符上提取两类特征:笔划属性特征和笔划分布特征,分别构成两个分类器对单个汉字字符进行字体识别,并集成两个分类器的结果得到最终的识别结果.我们使用的笔划属性特征分类器是文本无关的,而笔划分布特征分类器是文本相关的,集成的分类器属于文本相关的字体识别分类器.我们在包含7种字体的样本集上进行了测试,测试结果显示基于单字的字体识别率达到94.48%.  相似文献   

2.
Gabor滤波角度对字体识别结果有重要影响,由于字体纹理与自然纹理的不同,现有的Gabor滤波器角度参数不适于提取字体纹理的有效特征。基于字体纹理的多变性,该文提出使用遗传算法通过对字体纹理的学习优化滤波角度参数,使之能够适应字体纹理的特点,以提高识别率。通过对常用的4种字体899块字体纹理样本的测试表明:遗传算法能够找到适合字体识别的角度参数,使用新的角度参数减少了识别时间,提高了字体识别率。  相似文献   

3.
多字体字符识别的协同模型   总被引:3,自引:0,他引:3  
王海龙  戚飞虎 《计算机工程》2000,26(11):19-20,108
提出了一种新的用于多字体字符识别的神经网络模型-协同模型,同时提出了一种新的迭代的协同学习算法,该算法将误识率最高的模式的误识样本作为反馈量来修正原型模式。对大量实际采集所得的多字体字符样本的测试表明,该模型能对训练取得100%的识别率,对多字体字符测试亲本的识别也能取得很高的识别率(98.2%),而且识别速度很快,适用于实时的OCR应用。另外,对加噪字符的识别试验表明该模型具有很好的鲁棒性。  相似文献   

4.
汉字具有丰富的字体类型,并且不同的字体在汉字结构上有显著的不同,现在的OCR技术侧重字的识别,而对字体识别的关注较少。提出文字相关的单字符字体识别方法,利用文字相关的先验信息及字体结构特征,对字体的相似性度量采用向量空间模型,并针对常用66款简体字进行实验,得到了较好的平均识别率。  相似文献   

5.
基于纹理特征的汉字字体识别研究   总被引:2,自引:0,他引:2  
介绍了字体识别的重要性和有待解决的问题,提出了一种利用Gabor滤波器提取版面纹理特征进行字体识别的方法,着重介绍了滤液器设计、纹理特征提取和字体识别的过程。这种方法是与内容无关的,不需要局部微细特征分析,可以解决实际版面样弱印刷质量差、变形多的问题。用于常见字体的识别,取得了较好的效果。  相似文献   

6.
基于经验模式分解的汉字字体识别方法   总被引:7,自引:0,他引:7  
提出了一种基于经验模式分解(empirical mode decomposition,简称EMD)的汉字字体识别方法.通过对大量汉字字体的研究比较,选取了能反映汉字字体基本特征的8种基本笔画.以这8种汉字笔画为模板,在汉字文档图像块中随机地抽取笔画信息,形成笔画特征序列.通过对笔画特征序列作EMD分解,提取每个笔画特征序列的高频能量,并结合汉字文档图像块的平均灰度,形成字体识别的一个9维特征.  相似文献   

7.
曹春华 《电脑迷》2010,(22):21-21
在Word文档中设置不同的字体,谁都能掌握,之所以能设置不同的字体,是因为在系统字体文件夹中提供了各种不同的字体文件,如果你想拥有更多的字体,甚至想用自己的字体来装扮自己的文档,请随我来。  相似文献   

8.
字体展示     
想看到自己的字体被印刷出来吗? 如果你想让全球的设计代理公司更多的了解你设计的字体,请将样本寄给我们,也许你就会在这里看到它。  相似文献   

9.
20世纪90年代以来,随着现代设计理论的引入,数字制版技术的发展,中国在汉字印刷字体设计及字库发展上取得了长足的进步,涌现出类型丰富的大量优秀印刷字体。但相比其他使用汉字的先进国家及地区,无论在字体类型的丰富性和设计适应性上,都还有较大的差距,在书法字体设计中还存在着很多的问题。笔者通过对目前国内市场上已有的书法类字体的分析,提出了在书法字体设计中存在的一些问题,并提出了一些解决这些问题的角度和方法。  相似文献   

10.
徐彬 《微电脑世界》2002,(10):106-107
大家都知道,使用Microsoft Word(以下简称为Word)的“插入·符号”命令,可以在文档中使用一些很有特色的符号,这些符号来自于特别设计的字体,其中最常见的就是Windings字体。学会聪明地利用这些字体,可以很有效地美化我们的文档。  相似文献   

11.
汉字字模是各类电子装置显示汉字的依据,在工程应用中汉字字模都是从计算机的各种字库文件中获取,本文从应用的角度介绍了各类字库文件的组成原理,给出了提取字模的方法与相关的技术。  相似文献   

12.
汉字字形结构式压缩方法的研究和实现   总被引:2,自引:0,他引:2  
1 引言汉字字型技术作为计算机汉字信息处理技术的重要组成部分,经历了点阵汉字、矢量汉字发展到现在广泛应用的曲线轮廓汉字,其研究和应用取得了长足的进步。汉字字形有两个特点:汉字是基本笔划和字根在二维空间的组合,其字形结构复杂,笔划数目变化大,而且不同字体的形状特点也变化很大;汉字的字符集十分庞大,其中一二级汉字字符集  相似文献   

13.
字体表情自汉字诞生之初业已存在,其发展变化的助推力来源于人类从不间断的文明进程。印刷术的推广加快了字体审美表情的演变速度。当下汉字字体的结构韵律及审美表情千姿百态,与汉民族性格存在一定的映射效应。汉字字体借鉴诸多西方字体的结构特征,形态日渐丰富多样。为期达到最佳审美及实用功效,应根据字体的审美表情差异对汉字字体进行分类优选。  相似文献   

14.
继TrueType字体格式之后,微软公司和Adobe公司联合推出了Open Type格式,这一崭新的字体格式不仅以压缩方式增加了对Postscript字体的支持同时,在Unicode编码的大字符集基础上,采用多语种和多语系的编排方法,以适应更多的平台和全球性的国际字符集。此外,在功能上还容纳了多项传统排版软件才可具备的基本操作,如基线调整,竖排替换,灵活定位以及字符的组合和拆分等。无疑,这一开放的  相似文献   

15.
字形技术及OpenType字体文件格式研究   总被引:9,自引:4,他引:5  
随着Windows操作系统及TrueType字体(TTF)的流行,字形技术的重要性已越来越受到人们的关注。本文介绍了从TrueType、OpenType到Clear Type的最新发展,比较详细地分析了OpenType字体(OTF)文件的结构,解释了其中的重要描述表。用户若能正确掌握OTF字体文件格式,就可以建立自己的特殊字体,并可以在字体应用领域取得良好的应用效果。  相似文献   

16.
李建红  刘丹  徐展 《计算机工程》2014,(2):271-274,279
UCGUI是实时嵌入式系统中广泛使用的图形用户界面,但UCGUI不支持中文字符编解码。为此,提出一种支持中文字符编解码的方法。在分析UCGUI字符编解码框架基础上,修改内核代码,添加GB2312汉字编解码驱动,实现中文字符显示编解码服务。针对UCGUI中文显示时中文字库占用空间大与MCU存储空间有限的矛盾,提出一种字体驱动与字模数据分离的中文字体设计方法,包括为外扩字体设计专用驱动、字模数据存储接口及存储方法。在UCGUI仿真平台环境下的测试结果表明,该字库在UCGUI系列环境下,具有较好的可用性和通用性,可弥补UCGUI界面库在低成本嵌入式系统中难以实现中文显示的缺陷。  相似文献   

17.
开发适用于嵌入式设备的小型字库系统,介绍了字库系统的设计原则及各字库的编码和显示原理.系统已成功应用于一款有线数字电视接收机。  相似文献   

18.
基于MiniGUI的UCDOS字库接口实现   总被引:1,自引:0,他引:1       下载免费PDF全文
黄健 《计算机工程》2011,37(1):273-275,279
分析MiniGUI抽象的逻辑字体、设备字体和中文字符集操作接口和字库接口调用流程,针对开源的MiniGUI版本无大于16×16字体库的缺陷,实现UCDOS中文字库接口,与MiniGUI无缝结合,使得MiniGUI可任意使用UCDOS丰富的字库,支持大字体和多种字体风格。该接口适用于基于MiniGUI的嵌入式GUI交互界面的应用开发。  相似文献   

19.
基于文本字体的信息隐藏算法   总被引:4,自引:0,他引:4  
陈芳  王冰 《微机发展》2006,16(1):20-22
研究了文本信息隐藏技术,提出一种改进的改变文本载体字符字体的隐藏算法。该算法首先把秘密文本信息中的字符转换为ASCII码,再把ASCII码转化16位二进制码,然后把16位二进制码的高八位和低八位转换为十进制数,用RSA加密法将十进制数加密,最后把十进制码再转换成16位二进制码并利用伪随机置换法把秘密信息代码嵌入到载体文本中。嵌入时选取两种字体,若代码为“1”,载体文本的字体不变,若为“0”则改为一种与原字体相近的字体。通过这些处理手段大大提高了单纯的基于特征编码的信息隐藏技术的安全性。  相似文献   

20.
汉字书法是中华传统文化的代表,但是,由于书法字体具有风格迥异、结构复杂、变形繁多等特点,给大众学习和欣赏书法带来了极大障碍.为了解决普通老百姓解读书法作品的困难,提出一种基于改进DenseNet网络的书法字体识别算法,设计区域权值比例池化规则替换传统DenseNet网络的最大池化和平均池化规则,采用Nadam算法优化模型训练效果,进行自适应学习率调整,此外,提出基于剪枝技术的模型裁剪策略,在保证识别性能的同时,提高了模型的训练效率.实验结果表明,在由楷书、行书、隶书和篆书4类字体组成的混合字体数据集中,本文算法获得了96.13%的识别率,优于另外5种深度学习模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号