首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
进一步的“正易全”——三级汉字编码输入法   总被引:1,自引:0,他引:1  
本文报告“正易全”汉字输入法的新进展。从整体上来讲,正易全已发展成为全字笔顺、全字笔组和2 21 笔组三级输入法系列。前两级简单灵活,键选率极低,方便大字集查检;第三级在常用字和通用字中表现极佳,适合日常快速打字。在编码技术上,多笔笔组码元的选用、单结构的定义和多结构字的二部划分等方面都作了进一步的简化、系统化和规律化。此外,码表在GB1300011 字符集的基础上增加了1164 个港澳台地区用字或字形。  相似文献   

2.
《信息处理用GB13000.1字符集汉字部件规范》对于规范汉字形码输入法具有非常重要的意义。然而,在实际运用上却存在着部件数量太大,部件定义难以操作,部件拆分组合不易掌握等难处。造成困难的原因主要有: (1) 基础部件主要靠列表来确定, (2) 部件强调按理切分和成字组合, (3) 过多依赖“组字能力”的判别, (4) 过分注重部件数量的限制。要走出“难”的困境,应该在现有规范的基础上根据汉字的形态特征制定出简便可靠的部件识别规则和切分规则。实验证明,这种方法是行之有效的。  相似文献   

3.
X Window在汉字字形方面一直只支持点阵字形,另外字符集也只是针对GB2312 - 80 ,无法满足对大字符集汉字应用的需要。本文侧重于在X Window下“透明地”提供对CJK统一汉字字符集TrueType字形的支持。文章介绍了X Server的结构,详细描述了汉字字形文件处理器实现算法。  相似文献   

4.
小知识     
在说到汉字编码种类时,我们通常用到GB、BIG5什么的,它们的含义是…… GB:信息处理交换用汉字编码字符集——基本集,是以GB2312-80中国国家标准为基础的编码,有6763个汉字。其中一级字是常用汉字,计3755个,以汉语拼音字母为序排列;二级字是非常用汉字,计3008个,以部首、部首外笔划数排列。  相似文献   

5.
在充分研究汉字特征的基础上,遵照国家键盘汉字输入通用标准,开发了一种新的汉字编码输入法——音形码。该输入法采用汉字读音、偏旁部首读音、笔划读音及声调进行编码,拆字顺序完全符合汉字书写规则,克服了五笔输入法字难拆的不足,重码率大大低于拼音输入法。通过自建的基于VFP汉字输入法评测系统测试,结果表明,该输入法符合GB/T18031和GB/T19246提出的系统性能指标,具有简单易学、规范性强、重码率低、易推广的特点。  相似文献   

6.
记者牛晓云报道由五笔字型发明人王永民发明的“98规范王码”汉字输入法,作为我国第一个符合完全部件规范的形码输入技术,可处理中、日、朝三国文字和繁简体汉字,重码率低于5%,是原五笔字型的更新换代产品。这是3月3日记者在王码公司采访王永民总经理时获悉的。据王总介绍,“98规范王码”解决了以前不能处理国际标准的20902个汉字的难题,并可同时处理国际、BIG5及CJK三个字符集,为王码在国际上的应用铺平了道路。与其他输入方法重码率一般在20%相比,“98规范王码”的字根也  相似文献   

7.
该文从分析汉字特征信息编码的数字模型入手,介绍了在汉字输入方法研究中遇到的易学与重码的矛盾以及码长与重码的矛盾,对目前两类基于智能处理的输入法及“以字为基础,词为主导”的方法和“以词为驱动的整句转换”作了详细的分析,并对其代表性产品作了介绍。  相似文献   

8.
《信息处理用GB 13000.1字符集汉字部件规范》和《现代常用字部件及部件名称规范》这两个文件对规范汉字部件具有重要意义。但在实践中,它们存在着部件过多以及没有可行的拆分规则这两个最突出的问题,其原因是规范的制定缺乏系统和深层次的思考。要从根本上解决这些问题,就必须重新审视其中的拆分规则,将拆分规则和部件制定融为一体,并立足于有利于汉字输入、汉字教学和汉字检索这三者统一的层面来完善汉字部件规范。实验证明,这样做行之有效。  相似文献   

9.
基于汉字发生器的汉字字形CAD系统的设计   总被引:1,自引:1,他引:0  
本文提出一种基于汉字发生器的汉字字形计算机辅助设计系统的设计方案,系统功能上分为设计笔划形体和快速造字两部分, 在设定了笔划形体之后, 就能方便快速制造该字体的全字号、全字集的汉字。在ISO 10646 CJK 大字库的开发中, 初步得到验证, 综合性能高, 具有现实意义。  相似文献   

10.
专业录入人员常将五笔输入作为工作首选,笔 者在智能五笔输入法使用过程中,发现了一些小技 巧,在这里与大家一起分享。 汉字读音、编码轻松查 录入文章的时候,遇到生僻汉字不知道读音,可 以用智能五笔轻松查出。右键点击输入法的提示条, 打开“参数设置/汉字输出参数设置”窗口,勾选“输 出汉字读音提示”,点击“确定”后,用智能五笔输 入该汉字,输入法提示条中就可以显示读音了。 对于知道读音不知道编码的汉字,利用智能五  相似文献   

11.
无法直接输入计算机或现有的计算机系统字库没有的汉字称为生僻汉字或特殊字。对字库中已包含的生僻汉字,基于造字机理的皮氏输入法可以无重码输入GB18030-2005包括的70244个汉字。对字库中没有的汉字,按照智能造字原理,按照汉字结构和基元进行输入,并生成汉字图片。然后采用插件技术,将生僻字的图片插入到Microsoft Word文档中,以达到输入生僻汉字的目的,为在Microsoft Word文档中完全输入所有的汉字提供了一种方法。  相似文献   

12.
汉语是一种开放大字符集语言,汉字字形相似度计算是汉语信息处理的一项基础研究,对于汉字识别、计算机辅助的汉语文章校对和汉字教学都有重要作用.本文对现有汉字字形结构描述方法从图形相似角度进行了改进,并给出了一种基于结构描述的字形相似度计算算法,该方法计算相似度无需字形样本实例的学习训练,对于常用字和难于获取书写样本的生僻字的相似度计算,都具有很好的适应性,可满足不断扩大的汉字集合计算相似度的需要.实验表明,采用此法计算得到的GB2312中6763个汉字的相似字表,与人的认知结果吻合度很好,并应用于计算机辅助校对系统中的别字修改提示,显示出较好效果.  相似文献   

13.
智能型汉字数码输入技术的研究   总被引:1,自引:0,他引:1  
针对数字编码的特点,本文提出了一种在不改变编码方案的情况下通过改进输入规则,结合语言模型,实现汉字数字编码的智能输入技术。文章首先讨论了怎样设计字词码本结构,使之能够满足灵活多样的输入方式,继而设计了一种动态自学习语言模型,重点分析了数据平滑算法在语言模型中的应用与改进,最后通过一个输入法示例程序,对改进前后不同情况下的输入效果进行了测试。实验表明,这种输入技术不但降低了输入法的平均码长,而且显著地提高了首字命中率。  相似文献   

14.
西方拉丁字母和日本字体的种类都远远超过我国的汉字字体,借鉴和参考其优秀的字体来设计汉字字体是一条方便而快捷的丰富汉字字体种类的途径。我国少数民族文字种类异常丰富,其字体形态和结构也独具个性,汲取这些字体中的一些特征和元素融入到汉字设计中,也是汉字字体设计的一个思路和方法。  相似文献   

15.
一种利用校对信息的汉字识别自适应后处理方法   总被引:1,自引:1,他引:0  
后处理技术是汉字识别系统的重要组成部分。传统的识别后处理技术在很大程度上依赖于所训练的统计语言模型,没有考虑所处理文本的特殊性;而且没有利用识别器的动态识别特性。本文利用部分校对过的正确本文信息,一方面可以构建自适应语言模型,及时发现所处理文本的语言特点;另一方面可以利用识别器的动态识别特性,以修正候选字集;从而使得后续文本的识别后处理具有自适应性。40 万字的数据测试表明:这种方法的文本平均错误率较传统的后处理方法下降35.24%了,可以大大减轻数据录入人员的工作量,具有较高的实用价值。  相似文献   

16.
手写汉字识别是手写汉字输入的基础。目前智能设备中的手写汉字输入法无法根据用户的汉字书写习惯,动态调整识别模型以提升手写汉字的正确识别率。通过对最新深度学习算法及训练模型的研究,提出了一种基于用户手写汉字样本实时采集的个性化手写汉字输入系统的设计方法。该方法将采集用户的手写汉字作为增量样本,通过对服务器端训练生成的手写汉字识别模型的再次训练,使识别模型能够更好地适应该用户的书写习惯,提升手写汉字输入系统的识别率。最后,在该理论方法的基础上,结合新设计的深度残差网络,进行了手写汉字识别的对比实验。实验结果显示,通过引入实时采集样本的再次训练,手写汉字识别模型的识别率有较大幅度的提升,能够更有效的满足用户在智能设备端对手写汉字输入系统的使用需求。  相似文献   

17.
一种基于字词结合的汉字识别上下文处理新方法   总被引:6,自引:0,他引:6  
根据字、词信息之间的互补性,提出一种字、词结合的上下文处理方法.在单字识别的基础上,首先利用前向一后向搜索算法在较大的候选集上进行基于字bigram模型的上下文处理,在提高文本识别率的同时可提高候选集的效率;然后在较小的候选集上进行基于词bigram模型的上下文处理.该方法在兼顾处理速度的同时,可有效地提高文本识别率.脱机手写体汉字文本(约6.6万字)识别中的实验表明:经字bigram模型处理,文本识别率由处理前的81.58%提高至94.50%,文本前10选累计正确率由94.33%提高到98.25%;再经词bigram模型处理,文本识别率进一步提高至95.75%。  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号