首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
提出了自动计算汉字对应声母编码的概念,分析了基于汉字ASCⅡ码和汉字字符编码国标GB2312-80规则的具体实现思路及算法,并介绍了实现该算法的主要程序段.  相似文献   

2.
多文种环境下汉字内码识别算法的研究   总被引:9,自引:4,他引:9  
汉字内码向ISO/IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题,并提供了多种汉字内码识别算法,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上,本文对不同的识别算法进行分析和评估。在对目标样本的测试中,以上算法的识别率最高可以达到99.9%以上。  相似文献   

3.
杨康  袁海东  郭渊博 《计算机科学》2017,44(Z11):565-569
随着二维码应用领域的不断扩大,二维码的优化和改进也势在必行。二维码在汉字编码过程中采用定长编码模式,忽略了汉字使用频率对二维码汉字编码效率的影响,存在着较大的编码冗余。采用变长编码算法可以减少高频汉字的编码长度,降低二维码汉字编码的平均编码长度,增加编码容量。首先,结合常用汉字的使用频率,对二维码的汉字编码进行分段处理,分析并制定基于汉字使用频率的变长汉字编码表;其次,在不破坏二维码原有编码结构的情况下,仅对二维码的汉字编码采用变长编码方式;最后,分析并比较二维码定长汉字编码算法和二维码变长编码算法的时间性能和空间性能,给出优化及改进思路。实验证明,二维码变长编码算法可降低二维码汉字编码18.4%的冗余。  相似文献   

4.
针对中文文本结构的特点以及传统压缩算法对中文文本压缩的不足,提出并实现了一个基于PDC编码的中文文本压缩算法。该算法采用的是字典压缩方式。根据单个汉字在中文文本出现的概率,采用Huffman编码方式进行前缀变长编码;定义由某个汉字为前缀的词组和短语的深度;对具有相同前缀和相同深度的词组和短语进行局部的定长编码,构成一部压缩编码字典。通过对相同文本分别使用该算法和传统的LZW和LZSS编码算法压缩后得到的数据结果对比,压缩率有2.53%~40.48%的提高,表明该压缩算法有较好的压缩效果。  相似文献   

5.
王建平  王晓雪 《计算机应用》2007,27(12):3084-3088
针对汉字特点,提出一种基于汉字结构度和繁简度二类模态判别的多模式识别法。给出了汉字字型结构度类型的字型编码,以及汉字字型结构分解算法;对分解后的部件进行繁简度判断,依据各部件繁简度模态选择合适的特征提取算法,实现手写体汉字字型分解的多模式识别方法融合;对相似字采用两级分类的识别法,从而提高汉字的识别率和正确率。仿真实验验证了方法的有效性。  相似文献   

6.
本文分析了国内在引进的计算机上实现汉化过程中所存在的问题,并阐述合理解决这一“瓶颈”问题的方法,提出了汉字国标码“压缩密码型”通讯编码的设计方案。它对汉字国标码采取具有跟踪控制的压缩方法,对汉字辅助集可作隐含定义,能定义汉字达七万多;对汉字密码采用杂凑组合算法及动态设置方法,密码种类可达5×10~(15)种。在实际通讯中,本方案对各种计算机软硬件系统不作任何修改,只要求在汉字外设上设置,即可实现中西文兼容,并可避免各种编码的二义性,达到了系统软件对中西文完全兼谷、资源全部共享的汉字处理、密码通讯的目的。  相似文献   

7.
嵌入式TTS汉语语音系统的设计与实现   总被引:2,自引:0,他引:2  
通过使用改进的游程编码算法多重查找表设计及预存储命令字等技术实现了一种适、,用于广泛硬件平台的嵌入式TTS汉字语音系统其可发音字符涵盖了GB2312汉字编码字符集  相似文献   

8.
基于汉字结构的自然型文本水印算法*   总被引:6,自引:0,他引:6  
从汉字分类思维的角度,在充分利用汉字的二维象形性以及人眼视觉冗余特性的基础上,提出一种将结构化汉字字形拆分再重组的自然型文本水印算法。该算法通过汉字字形的拆分,增加了文档内容编码冗余,提高了水印信道容量,并通过调整汉字显示属性,增强水印的隐蔽性。最后对其进行实验验证,证明该算法兼具格式水印隐蔽性和语义水印鲁棒性的双重优点,并具有嵌入空间大的特点。  相似文献   

9.
针对当前汉字输入法普遍存在的不足,提出了一种新音形编码汉字输入法,即利用汉字的首拼音、韵母及组成汉字的基本笔画和少数高频部件来对汉字编码,是对以前笔画和音形编码汉字输入法的改进。它既有笔画输入法低重码率、输入高效的特点,又切合广大拼音输入法用户的输入习惯,能够很好地满足多种用户群的需求。阐述了这种编码输入法对汉字的编码规则,对各编码的按键分布及重码率进行详实的统计,深入分析论证了其重码率低的优点,简要介绍了这种输入法在Android平台下的实现。  相似文献   

10.
为了解决二维码在证件类应用中常常面临的冷僻字编码问题,以GB18030字符集为对象分析汉字编码特点,提出基于该标准的汉字与ASCII混合信息的PDF417编码方法。并针对当前广泛应用的16位编程工具,结合实例给出了一种拆分迭代编码算法来实现字节压缩模式,它能够在保证较高编码效率的基础上有效节省编码存储空间。  相似文献   

11.
结合开发实际,介绍了笔顺输入法中汉字搜索算法和字码表及词码表的生成过程。从排序和查找两方面考虑,首先将汉字字库生成汉字字码表,然后将字码表根据首笔进行分区,当用户输入首笔后由汉字字码表索引文件决定在哪个分区范围内进行查找。实例证明本方法满足查找速度要求。  相似文献   

12.
主要介绍低功耗芯片MSP430与内含GB2312国标一级简体汉字库的图形点阵液晶显示模决OCMJ5*10B的硬件连接方式、控制流程、软件实现方法.  相似文献   

13.
一种融合多种编辑距离的字符串相似度计算方法*   总被引:5,自引:0,他引:5  
针对中西文混合字符串,采用了将汉字作为西文字符的等价单位计算编辑距离的方法,并从输入法的角度提出了采用拼音编码和五笔编码计算编辑距离的方法,最后给出了融合三种编辑距离计算字符串相似度的算法。仿真结果表明,该方法在提高相似重复记录检测的查全率的同时,也能获得较高的查准率。  相似文献   

14.
朱永强  江雪 《微机发展》2014,(2):67-70,75
模式匹配算法一般不具有所有环境下的通用性,不同的算法在不同语义环境下的表现,往往差异较大。为实现中文环境下对模式串的快速多模式匹配,选择出在中文环境下的最优匹配算法,分析了几种经典的多模式匹配算法。通过对各个算法设计思路、时间性能与空间性能的研究,推导出基于“坏字符”的算法设计思路最适用于中文环境下大字符集、短字符串的特点,并通过实验对理论推测的中文环境最优算法-Wang算法的性能与其他几种经典算法的性能进行了比较,验证了理论推导的正确性。  相似文献   

15.
论文从实用的角度,着重研究了有限自动机算法在文本的不精确匹配中的应用,提出了一种用于中文精确匹配的自动机的构建思想,两种用于中文同音字匹配的自动机的构建思想,以及利用自动机的原理去除无用字符对文本匹配的干扰的方法。编程实现了上述三种自动机算法并对其作了测试,给出了三种算法各自的性能测试数据。  相似文献   

16.
“炎黄”中文平台结构设计   总被引:3,自引:1,他引:2  
随着我国计算机应用水平的提高, Internet的迅速普及, GB2312 - 80中的6763个汉字已不能满足应用的需要。ISO 10646标准的制定,使得为开发支持大汉字字符集的中文平台提供了宽阔的代码空间。 我们的工作目标就是探讨在现有的的开放系统上,提供支持ISO 10646标准CJK大字符集、支持多种内码、兼容现有中文平台、与原英文系统及版本无关、符合国际、国家标准、具有一定跨平台功能、实用高效的中文平台解决方案及实现技术。 本文详细阐述了该中文平台的设计目标、模块结构、以及各个子系统的实现方法。  相似文献   

17.
介绍了在Web系统中通过采用窗体身份验证和附加码技术来增强Web认证系统的安全性.附加码显示的是系统随机产生的GB2312码的一级汉字的图像,并给出了ASP.NET实现的关键程序代码.  相似文献   

18.
智能型汉字数码输入技术的研究   总被引:1,自引:0,他引:1  
针对数字编码的特点,本文提出了一种在不改变编码方案的情况下通过改进输入规则,结合语言模型,实现汉字数字编码的智能输入技术。文章首先讨论了怎样设计字词码本结构,使之能够满足灵活多样的输入方式,继而设计了一种动态自学习语言模型,重点分析了数据平滑算法在语言模型中的应用与改进,最后通过一个输入法示例程序,对改进前后不同情况下的输入效果进行了测试。实验表明,这种输入技术不但降低了输入法的平均码长,而且显著地提高了首字命中率。  相似文献   

19.
引入方向代码的概念,将联机手写笔画的运动轨迹转换成由方向代码组成的序列。通过分析代码序列中的噪声因素,归纳了噪声的种类,进而设计并实现了一种基于方向代码序列的滤波算法,为联机手写汉字的识别奠定了基础。结合实验完成了滤波、归并和匹配各个过程的设计,从而完成了单笔画及连笔部件的识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号