首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
汉字字形结构式压缩方法的研究和实现   总被引:2,自引:0,他引:2  
1 引言汉字字型技术作为计算机汉字信息处理技术的重要组成部分,经历了点阵汉字、矢量汉字发展到现在广泛应用的曲线轮廓汉字,其研究和应用取得了长足的进步。汉字字形有两个特点:汉字是基本笔划和字根在二维空间的组合,其字形结构复杂,笔划数目变化大,而且不同字体的形状特点也变化很大;汉字的字符集十分庞大,其中一二级汉字字符集  相似文献   

2.
张莉  栗青生  刘泉 《计算机科学》2016,43(Z11):417-421
提出了一种云端信息安全字形的生成模型。该模型将汉字的字形抽象为汉字结构模式和汉字的风格模式,然后通过定义有效的汉字结构输出和汉字笔画生成方案,动态地生成了可用于信息安全保护的信息安全字形。该模型实现了汉字字形的Web存储和在客户端的特征字形的输出的监控,克服了现代汉字由于整字编码而导致的汉字信息在云端安全服务方面的不足,为汉字信息的云端存储和云端数据安全服务保护提供了一种有效的策略和方法;同时,也为设计更深层次的云端汉字信息服务系统奠定了基础。  相似文献   

3.
对汉字的认知研究不仅是认知科学、也是计算机科学特别是人工智能领域中的一个研究热点.但是,目前汉字认知的计算机模拟研究还相对滞后,其在认知科学研究中的作用还无法和行为实验研究等同.从认知科学的角度出发,建立汉字字形表征库,构建模型,确定训练和测试方式等,对汉字字形认知过程(学习发展历程)中汉字聚类与部件拆分意识进行了计算机模拟,以便研究汉字字形学习中的某些认知规律.通过对模型的训练与测试,得到了输入汉字的聚类效果图、部件拆分情况,以及对模型进行生字测试的结果.得出的结果能够反映某些汉字认知的规律,所以模型在一定程度上模拟了汉字字形的认知过程.  相似文献   

4.
一个基于骨架汉字技术的字形设计与显示系统SCCDS   总被引:2,自引:0,他引:2       下载免费PDF全文
介绍了一个基于骨架汉字技术的字形设计与显示系统SCCDS。利用骨架汉字数据结构的灵活性, 该系 统能方便地进行字形的交互输入和修改。  相似文献   

5.
介绍一种汉字小字形库的建立方法及相应的程序,可用于对汇编源程序中,已按一定格式说明的汉字进行预处理,生成汉字字形数据追加于原文件尾部。  相似文献   

6.
提出基于胶囊神经网络(CapsNet)的汉字字形表征模型,通过表征汉字字形中的部件实现汉字字形的表征.首先,对任一汉字字形生成所有部件类别的表征向量.然后,根据部件存在概率,利用基于欧氏距离的离群点检测,选取相应的部件表征向量.最后,由选出的部件表征向量组成该汉字的字形表征.实验表明,文中模型在仅经过部件字形训练的情况下,即可有效识别汉字部件,同时自动生成汉字字形的有效表征.  相似文献   

7.
汉字认知心理研究对机器自动识别汉字的启示   总被引:4,自引:1,他引:3  
几项认知心理学实验研究从不同角度一致证实, 方块汉字的四个等分象限所含的字形特征信息童不同。在人类识别汉字时作用也不一样。其中以左上象限最重要, 右下象限的作用则要弱得多。本文结合部件的象限位置频率, 讨论了这些结果对汉字机器识别的一些启示。  相似文献   

8.
林民  宋柔 《中文信息学报》2008,22(3):115-123
目前汉字字形描述方法存在的主要问题是缺少能涵盖一切可能汉字的可计算的字形形式化描述体系,从而造成汉字处理应用中的一系列障碍。本文给出了一种汉字网格字形描述方法,实验表明,该方法具有描述一切可能汉字字形(包括错字)骨架的能力,支持不同颗粒度的构字元素、结构关系等字形特征的自动提取和计算,为字形特征的自动分析处理提供了一种有效的手段,从而也为基于字形计算的各种应用建立了可靠的基础。  相似文献   

9.
由于目前计算机缺乏对汉字字形统一有效的形式化描述和比对计算方法,致使无法描画输入所需的各种可能汉字,也无法利用计箅机对字形进行比对分析.提出一种具有颗粒度适当、无歧义、规范化基元,能描述各种可能字形(包括错字、古籍异体字、拼合字)骨架异同的笔段网格汉字字形描述方法;并基于该方法给出了字形比对算法,它能自动提取字形包含的简单笔画和复合笔画,根据字形的不同自适应地选取复合笔画或简单笔画,并以此为单位进行比对;最后将计算两字形最优配对笔画间的向量距离总和作为比对结果.实验结果表明,该方法具有很强的字形描述能力,字形比对算法对结构规范字形的比对准确牢较高,可用于支持各种汉字的描画输入及面向字形比对分析的各种应用.  相似文献   

10.
本文通过研究图形学中图与图之间的关系以及人们对汉字认知习惯的特点,将汉字拆分为多个汉字组件。将每个汉字组件看作一个图形单位,对照图与图之间的关系,将这些汉字组件进行重新的组合,从而使同一个汉字具备了多个字形。通过使用不同的字形,将水印信息嵌入到文本当中。实验证明,在水印的不可感知性、鲁邦性等方面均获得了很好的效果。  相似文献   

11.
字体表情自汉字诞生之初业已存在,其发展变化的助推力来源于人类从不间断的文明进程。印刷术的推广加快了字体审美表情的演变速度。当下汉字字体的结构韵律及审美表情千姿百态,与汉民族性格存在一定的映射效应。汉字字体借鉴诸多西方字体的结构特征,形态日渐丰富多样。为期达到最佳审美及实用功效,应根据字体的审美表情差异对汉字字体进行分类优选。  相似文献   

12.
为了揭示汉字字体与受众的情感意象之间的内在关系,从认知计算的角度出发, 探索构建一种“设计特征-结构指标-意象”的灰箱关联模型,以其预测汉字字体的多个意象。首 先依据认知计算的原理将字体结构规则抽象为知识,运用产生式规则将字体结构知识进行定量 描述,提出字重、重心、字面、字怀 4 个字体结构指标的认知计算公式,将无序的形态信息转 化为结构化的有序信息。然后基于汉字字体意象认知系统的非线性耦合的特点,发展出一种运 用多输出最小二乘支持向量回归机(MLS-SVR)进行汉字字体多意象预测的方法。将该方法对汉 字字体的 3 个意象进行预测,实验结果表明其具有良好的预测效果和精度。该模型可作为字体 智能设计系统的适应度函数,为发展字体智能设计提供有益的参考。  相似文献   

13.
对基于Fourier描述器的汉字字形生成及合成算法进行了改进。通过增加重复点和线段细分,改善了汉字的重构效果,提供了汉字笔划顺序调整、笔划起点调整和跟踪方向的一致性处理算法,处理后的汉字可完全满足使用Fourier描述器合成汉字字形的三个必要条件。  相似文献   

14.
一种实用的汉字字形合成方法   总被引:2,自引:0,他引:2       下载免费PDF全文
提出一种实用的汉字字形合成方法。本方法用三次B-样条插值曲线表示字形笔划的轮廓线。根据B-样条插值曲线的连续性与唯一性,在待合成字形笔划曲线之间建立对应关系。给定合成比例系数,统一曲线控制点长度与参数取值范围,得到新的字形笔划曲线表达式,产生新的汉字字形。从实验结果看,该方法简洁,容易实现,不失为一种有效的汉字字形合成方法。  相似文献   

15.
汉字具有丰富的字体类型,并且不同的字体在汉字结构上有显著的不同,现在的OCR技术侧重字的识别,而对字体识别的关注较少。提出文字相关的单字符字体识别方法,利用文字相关的先验信息及字体结构特征,对字体的相似性度量采用向量空间模型,并针对常用66款简体字进行实验,得到了较好的平均识别率。  相似文献   

16.
Outline字体结构式压缩算法及其实现   总被引:2,自引:0,他引:2  
针对CJK Outline字体在存储量上存在的不足,本文提出一种结构式压缩算法。算法对CJK字体进行集合变换,得到笔划集合元素;并利用聚类算法得到模板笔划;对相似数据进行统一存储与调用。同时,本文还提出了一种基于笔划段的笔划抽取算法,从图论角度实现了集合变换。结果显示,算法取得了较好的效果,而且适用于多种字体。  相似文献   

17.
软件产品的标准符合性测试是衡量产品质量与性能的重要方法。本文根据藏文字符集标准与字型标准,按软件产品的可用性原则,分析与定义了藏文字库标准符合性检测的含义与内容。本文提出了实施藏文字库标准符合性测试的方案与算法,实现了藏文字库测试程序。测试结果表明本文的检测方案可行、完整,也为其他文字的字库标准符合性检测提供了很好的途径。  相似文献   

18.
针对部件组字过程中由于缩放变换造成的部件笔画粗细和衬线失真的问题, 提出了一种通过优化缩放变换直接生成目标字形的方法。通过部件变换序列的生成算法以及笔画变换操作算法实现了由原始部件直接生成目标部件的缩放变换。原型系统的实验结果表明, 该方法能够实现汉字部件的无失真缩放变换, 从而提高了汉字组字系统生成字形的质量以及字库自动化生成的效率。  相似文献   

19.
汉字字形的凸剖分变形及合成   总被引:2,自引:1,他引:1  
文中提出了一种全新的基于凸多边形变形的汉字字形自动生成方法. 通过对字体的凸剖分,把字体分解成若干个子凸多边形,并经过全局优化迭代建立两种不同字体的子凸多边形间的匹配关系,计算两匹配子凸多边形的形态和,再进行合并,则得到合成后的字体.理论上证明了此方法的正确性,讨论了不同剖分对生成字形的影响,可解决不同构字体间的合成问题,通过不同的结构元的形态变换,实现不同字体的衍生.实验证明此方法生成的汉字字形多,质量好,自动化程度高,并可用于三维字体生成.  相似文献   

20.
After the computer became a tool for data sharing and information exchange, the unified computer font has made the text lose the diversity and discreteness of handwriting. Text is the crucial factor for the spread of culture and civilization. Many electronic books have lost the characteristic fonts with cultural background and historical significance in the original ancient books after the digitalization. One example is the sculpted typeface with diversity and discreteness that can be called a Tibetan culture. In order to solve this problem, a research method of digitizing engraving fonts in ancient Tibetan books is proposed. Firstly, the projection method and the connected domain method are used to segment the ancient book image. Secondly, the GIST feature algorithm is used to realize the image text recognition. Thirdly, the SIFT feature algorithm is used to implement the image font style classification, and diffe rent styles of carved fonts in the ancient books are obtained. A font diversity expression algorithm is proposed to realize the diversity and discreteness of carved fonts in ancient books. The purpose of the research is to achieve the inheritance and protection of engraving fonts, which has important cultural research and inheritance significance.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号