首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对移动终端的特点,结合汉字组件技术以及矢量笔画字体提出一种字库存储结构,并针对笔画字体提出一种轮廓化算法.在字库中将汉字信息分为索引、汉字结构信息、汉字组件矢量数据信息3个部分来存储,具有占用空间小、合成速度快的优点,解决了以往汉字组件字体失真的问题.轮廓化算法根据笔画线段信息,只需遍历一次就可完成多边形轮廓的确定,且其中优化了生成的多边形顶点数量,考虑了遍历过程中的异常情况,降低了渲染负担.该算法也可经过少许改动成为通用的描边算法.在移动终端上进行实验的结果表明,使用该字库及相应轮廓化算法取得了良好的效果.  相似文献   

2.
提出了一种获得汉字笔画种类及其拓扑结构的新方法.通过分析TrueType字库存储的汉字字形信息,构造笔画图形并提取出笔画特征,采用统计分类和边界关键点定位相结合的方法,利用综合分类法实现了对二级6763个汉字的笔画种类和拓扑结构的基于XML的语义知识表达,可结合前端输入程序进行快速搜索和定位.为字体变形、字体自动生成、汉字知识挖掘等提供了必需的基本信息.实验表明这种方法能够准确、有效地识别汉字笔画及其拓扑结构.  相似文献   

3.
汉字是中华民族传统文化的核心和信息交流的主要工具,古老而复杂多样的汉字属于二维,不像英文等西方文字那样是一维线形文字,可以直接输入计算机,而是需要采用特殊的汉字输入法软件.汉字输入计算机是计算机中。第一个环节,汉字输入技术直接影响着中文信息处理的发展.本文着眼于汉字输入法软件在系统中的设计和开发过程,提出一种简单、方便的汉字键盘输入法。首先统计了国标二级字库中汉字笔画信息的各种数据,这些数据主要包括:汉字的平均笔画数及按使用频度加权的平均笔画数、能与其它字区分开的汉字前若干笔画的平均数、以各种笔画起笔的汉字数、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字以及汉字字库中相邻笔画的频度等。根据这些统计数据,我们采用书写汉字时的笔画顺序作为汉字输入码,设计了笔画码汉字输入法和实现该输入方法的键盘。  相似文献   

4.
完全基于结构知识的汉字笔画抽取方法   总被引:17,自引:1,他引:16  
从汉字结构知识出发,提出了一种从汉字图像直接抽取笔画的算法,给出了抽取横、竖、撇、捺4种笔画的完全量化的昨去除不同字体的笔画修饰噪声的规则,该方法较好地解决了各笔画的相交、相连及噪声排队等总理2,综在汉字识别及字体自动生成等汉字信息处理方面有重要作用。  相似文献   

5.
TrueType字体技术的研究分析与应用   总被引:1,自引:0,他引:1  
为了在应用程序中显示汉字的笔画,介绍了采用曲线轮廓描述技术的TrueType字体,研究分析了TrueType字形描述技术原理和TrueType文件结构,利用字体创建软件建立了汉字笔画的TrueType字体文件。  相似文献   

6.
顾翼  武妍 《计算机工程》2011,37(3):266-268
针对手写体汉字合成困难的问题,从离线手写体汉字样本的结构知识出发,提出一种合成手写体汉字的方法。该方法采用改进的方向游程算法提取汉字的笔画,并建立笔画框,从笔画框的结构知识出发构建起字体信息来合成汉字。实验结果证明,该方法可以较好地合成汉字,且容易识别,对光学字符识别有较好的抵抗能力。  相似文献   

7.
现有的Webfont汉字生成方法,需要设计专门的字库,工作量大且灵活性差。针对这一问题,将汉字特征点用字形动态描述库记录,在此基础上提出一种新的Webfont汉字的自动生成方法。研究基于特征点描述的汉字笔画提取、连接和优化方法,并对比基于B样条曲线和贝塞尔曲线的字形优化效果。为方便用户进行个性化字体生成,设计了用户自定义字形优化方法。实验结果证明,基于汉字字形动态描述库,用户无需下载字库,即可以在网页上生成符合自身需求的Webfont汉字。  相似文献   

8.
本文分析SUN工作站BDF字体文件格式及UCDOS矢量汉字字库,提出SUN工作站字体扩充方法及实例。  相似文献   

9.
基于经验模式分解的汉字字体识别方法   总被引:7,自引:0,他引:7  
提出了一种基于经验模式分解(empirical mode decomposition,简称EMD)的汉字字体识别方法.通过对大量汉字字体的研究比较,选取了能反映汉字字体基本特征的8种基本笔画.以这8种汉字笔画为模板,在汉字文档图像块中随机地抽取笔画信息,形成笔画特征序列.通过对笔画特征序列作EMD分解,提取每个笔画特征序列的高频能量,并结合汉字文档图像块的平均灰度,形成字体识别的一个9维特征.  相似文献   

10.
一种基于笔划映射的曲线轮廓汉字字形设计方法   总被引:1,自引:1,他引:1  
本文介绍了一种以汉字间架结构和基本笔划为汉字的知识表示,通过由导向因子和宽度因子控制的笔划映射来设计曲线轮廓汉字字形的方法。该方法以一套汉字间架结构库和一个基本笔划库为基础,可生成多种粗细的多套字库。改变基本笔划库,可改变生成的字体种类。  相似文献   

11.
中文汉字在横向、纵向展开具有二维的复杂结构。现有的中文词向量研究大都止步于汉字字符,没有利用中文笔画序列生成字向量,且受限于统计模型本质,无法为低频、未登录字词生成高质量向量表示。为此,该文提出了一种依靠中文笔画序列生成字向量的模型Stroke2Vec,扩展Word2Vec模型CBOW结构,使用卷积神经网络替换上下文信息矩阵、词向量矩阵,引入注意力机制,旨在模拟笔画构造汉字的规律,通过笔画直接生成字向量。将Stroke2Vec模型与Word2Vec、GloVe模型在命名实体识别任务上进行评测对比。实验结果显示,Stroke2Vec模型F1值达到81.49%,优于Word2Vec 1.21%,略优于GloVe模型0.21%,而Stroke2Vec产生的字向量结合Word2Vec模型结果,在NER上F1值为81.55%。  相似文献   

12.
曲线轮廓汉字自动生成及其变形方法   总被引:5,自引:0,他引:5  
本文介绍一种基于曲线轮廓汉字和Fourier级数描述的汉字变形新方法。该方法利用曲线轮廓所提供的字形笔划结构特征信息,运用多级数学模型,通过计算机软件功能,对字形自动进行变形,生成一系列形式多样的新字形,是一种动态汉字库技术。  相似文献   

13.
利用投影特征高速识别车牌中的汉字   总被引:4,自引:0,他引:4  
基于在车牌中使用的汉字固定,且数量很少,其中的汉字字体均有国家标准确认等特点,该文提出了一种根据汉字的投影特征来识别车牌中的汉字的方法,它利用汉字图像投影图,找出汉字笔画数量、结构,以及其中长竖线长横线的数量等特征,用这些特征有效、高速地识别车牌中的汉字。  相似文献   

14.
针对中文文本存在的版权保护问题,文章提出了一种新的文本水印算法。该方法通过汉字数学表达式,获取汉字的结构类型和笔画数,利用汉字的结构类型将整个文档分成两块,在各块中由汉字笔画数和水印比特位共同确定水印加载的位置,通过设置字体下划线以嵌入水印。水印提取时不需要原始文档和原始水印,通过块校验和海明校验可将破坏的水印比特位进行恢复。实验结果表明该算法具有较好的透明性和鲁棒性。  相似文献   

15.
无法直接输入计算机或现有的计算机系统字库没有的汉字称为生僻汉字或特殊字。对字库中已包含的生僻汉字,基于造字机理的皮氏输入法可以无重码输入GB18030-2005包括的70244个汉字。对字库中没有的汉字,按照智能造字原理,按照汉字结构和基元进行输入,并生成汉字图片。然后采用插件技术,将生僻字的图片插入到Microsoft Word文档中,以达到输入生僻汉字的目的,为在Microsoft Word文档中完全输入所有的汉字提供了一种方法。  相似文献   

16.
借鉴仿生模式识别的认知观点,从汉字的构造机理和人类认识汉字的习惯角度出发,提出一种基于小波变换的图像汉字识别方法。制定了图像汉字笔划特征提取的具体规则,采用小波变换的方法对图像汉字边缘和笔划轮廓进行检测,通过有效提取图像汉字笔段信息,进行笔段合成,生成汉字或汉字的基本笔划。仿真实验结果表明,这种方法提高了图像汉字笔划特征提取的准确率和稳定性,对于印刷体和书写较规范的手写体图像汉字具有极高的识别率。  相似文献   

17.
汉字字体风格迁移旨在保证在语义内容不变的同时对汉字的字形作相应的转换。由于深度学习在图像风格迁移任务中表现出色,因此汉字生成可以从汉字图像入手,利用此技术实现汉字字体的转换,减少字体设计的人工干预,减轻字体设计的工作负担。然而,如何提高生成图像的质量仍是一个亟待解决的问题。本文首先系统梳理了当前汉字字体风格迁移的相关工作,将其分为3类,即基于卷积神经网络(convolutional neural network,CNN)、自编码器(auto-encoder,AE)和生成对抗网络(generative adversarial network,GAN)的汉字字体风格迁移方法。然后,对比分析了22种汉字字体风格迁移方法在数据集规模方面的需求和对不同字体类别转换的适用能力,并归纳了这些方法的特点,包括细化汉字图像特征、依赖预训练模型提取有效特征、支持去风格化等。同时,按照汉字部首检字表构造包含多种汉字字体的简繁体汉字图像数据集,并选取代表性的汉字字体风格迁移方法进行对比实验,实现源字体(仿宋)到目标字体(印刷体和手写体)的转换,展示并分析Rewrite2、zi2zi、TET-GAN(texture effects transfer GAN)和Unet-GAN等4种代表性汉字字体风格迁移方法的生成效果。最后,对该领域的现状和挑战进行总结,展望该领域未来发展方向。由于汉字具有数量庞大和风格多样的特性,因此基于深度学习的汉字生成与字体风格迁移技术还不够成熟。未来该领域将从融合汉字的风格化与去风格化为一体、有效提取汉字特征等方面进一步探索,使字体设计工作向更灵活、个性化的方向发展。  相似文献   

18.
MST在手写汉字切分中的应用   总被引:7,自引:0,他引:7  
韩勇  须德  戴国忠 《软件学报》2006,17(3):403-409
手写汉字切分是根据输入笔迹的空间位置关系进行汉字部件的合并切分,形成完整的汉字笔划以便进行识别处理.综合利用了汉字部件的结构位置关系和笔划的空间位置关系,根据笔划的最小生成树(minimal spanningtree,简称MST)对联机连续手写输入汉字进行切分,取得了较好的切分结果.切分的准确率超过91.6%.  相似文献   

19.
水族文字被称为水书。为了满足水书研究者和出版业界的需要,设计了水字字符集的Unicode编码,利用字体制作软件建立了水字TrueType字库。该文提出了一种基于笔形特征的编码方法,依据编码规则取水字3个角的笔形组成有序序列,为水字编码。利用Windows系统的IMM-IME机制,实现了水字笔形输入法。  相似文献   

20.
将粗分类应用于脱机手写汉字识别中,采用这种多层次分类策略,能有效地改善识别的性能,提高识别精度。本文提出了一种利用四角区域结构特征对手写汉字进行粗分类的方法。在对汉字基本笔画进行分析的基础之上,根据手写汉字形变的特点以及识别算法的要求,定义一组新的笔画单元,并将这些笔画单元与汉字特定区域内的结构进行比对,得到一组4位结构特征编码,以此作为脱机手写汉字粗分类的依据。对GB2312一级字库中的部分手写汉字进行采样和识别实验,结果证明改进的四角结构特征用于粗分类的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号