首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
多文种环境下汉字内码识别算法的研究   总被引:9,自引:4,他引:9  
汉字内码向ISO/IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题,并提供了多种汉字内码识别算法,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上,本文对不同的识别算法进行分析和评估。在对目标样本的测试中,以上算法的识别率最高可以达到99.9%以上。  相似文献   

2.
IT专利扫描     
《计算机》2000,(12)
发明名称:梅花汉字输入法 专利简介:梅花汉字输入法是将汉字输入电脑的一种新方法。主要特征是取汉字的声母,组成汉字单元的成字声母、汉字首末次笔划声母的取码方法,所取的声母就是电脑键盘的相应的英文字母。 发明名称:综合性汉字编码法及键盘 专利简介:本发明属于计算机汉字处理系统中的一种综合性编码系统及键盘设计。它采用通用键盘中的40个符号键做码元,使双拼码、拼形码、新文字码、语词码,四种编码自成一套系统,码长为1-4码,实现了易学和快速的统一,适用于不同文化程度、不同专业的专职的或非专职的打字人员。该码…  相似文献   

3.
目前常用的音序汉字序列并不符合中国人对汉字排序的观念,能够反应汉字特征的是汉字的笔画.结合汉字的重编码与汉字笔画排序规则,提出在计算机上实现汉字按笔画序规则排序的方法,根据重编码和内码的性质,在第一次排序结果的基础上再进行一次排序,使得排序搜索速度得到有效提高.  相似文献   

4.
为Windows创建Unicode内码输入法   总被引:1,自引:0,他引:1  
1引言目前,计算机的内码正在使用(GBK)内码,并正在向国际标准(UCS)标准,向Unicode编码过渡,然后使汉字的处理不仅仅是6763个汉字,而是20902个汉字,并将处理国际标准的多国文字的三万左右的字符集,其中汉字接近二万八千个。接触过Uni...  相似文献   

5.
在网络上使用中文电子邮件,经常会发生乱码现象。为什么会出现乱码现象?这要从计算机中的汉字信息处理谈起。汉字文化圈内的各国和地区,在西文编码的基础上,设计了不同的汉字编码集,这些编码很多,内在而言,有一点相同的是,都用两字节表示一个汉字或汉字字符,叫汉字内码。有代表性的汉字编码有:GB码即国标码.也叫GB2312或GB2312-80,在中国大陆和新加坡等地广泛使用;GBK码是对GB码的扩展和补充,该编码拥有二万多个简繁汉字,中文简体版WIN95、WIN98系统都选用它作其汉字内码;在台湾、香港等使用繁体汉字的地区,普遍使…  相似文献   

6.
许成文  刘会杰  周维 《福建电脑》2008,(2):176-176,139
在实际应用中,特别是在需要实时大量输入汉字的显控处理应用中,利用传统单片机显控设计方法是无法实现的。本文通过对汉字内码的分析,给出硬件汉字库的制作方法,提出针对一、二级汉字库编码检索的拼音输入检索方法,利用AVR8515单片机为核心处理芯片,设计一种具有通过键盘,用汉语拼音输入法,输入汉语拼音,利用相应程序通过编码检索,在显控系统中实时输入汉字,并在LCD上显示的方法。  相似文献   

7.
提出了自动计算汉字对应声母编码的概念,分析了基于汉字ASCⅡ码和汉字字符编码国标GB2312-80规则的具体实现思路及算法,并介绍了实现该算法的主要程序段.  相似文献   

8.
提出了自动计算汉字对应声母编码的概念,分析了基于汉字ASCII码和汉字字符编码国标GB2312-80规则的具体实现思路及算法,并介绍了实现该算法的主要程序段。  相似文献   

9.
汉字化是NLS(National Language Support)潮流中的重要组成部分。汉字化的中心任务是以汉字内码为基础, 树立汉字数据类型。本文提出了理想汉字内码的若干特征, 并以此为基础,对主要的实用汉子的内码进行了分析比较, 进而阐明了汉字内码与汉字数据类型的区别与联系, 指出了汉字数据类型与相应操作的匹配问题。 作者认为汉字内码的研究与规范化是当前汉字化的瓶颈问题和信息系统建立的当务之急。  相似文献   

10.
一种汉字小字库的生成方法   总被引:2,自引:0,他引:2  
本文提出一种不需修改用户源程序中的汉字内码,自动查找用户源程序中的汉字内码建立汉字小字库文件和提取汉字小字库字模的新方法  相似文献   

11.
本文在分析IVS,CCDOS,ZXDOS等汉字操作系统的内码结构的基础上,提出了执行相应汉字信息互换一种软件设计和实现。  相似文献   

12.
本文对网络上汉字的显示与传输进行了研究,提出一种新的在Web服务器端直接解决汉字繁简体内码转换的方案,使得只有一种内码的中文主页也可以自动地对不同内码浏览器提供支持,而不必要求客户端安装软件。这种思想在Windows NT下用IIS里的ISAPI过滤器得以实现。  相似文献   

13.
往往向大陆以外的地区发送中文电子邮件时,若对方没有中文平台看到的电文将是一堆乱码。即使有中文平台,若不是简体中文win95,也要进行‘内码转换’才能看到清楚的中文,否则看到的也是一堆乱码。 一般大陆使用的简体中文windows95平台的汉字内码是GB;台湾地区使用的繁体中文windows95平台的汉字内码是Big5;香港、澳门地区比较复杂,有用上述两种平台的,也有用英文windows95加挂中文之星、UCWIN、四通利方等中文平台的,其汉字内码是  相似文献   

14.
本文指出现行的汉字编码在现实应用中的缺陷,提出编号内码和拼音内码的概念,并首次提出以拼音字母作内码的汉字拼音内码方案。  相似文献   

15.
回音     
答邓海先生(1995.6.P154) 您所遇到问题是因为KV100软件将CEGA卡的工作方式切换成014汉字显示方式造成的。这时由于西文制表符与汉字内码编码重复,所以显示为汉字。 CEGA卡提供了两种工作方式,即014方式和EAG方式。014方式提供了高分辨率汉字字符显示方式,EGA方式兼容国际上流行的EGA显示方式。通常两种工作方式之间的切换是通过卡上的乒乓开关实现的,开关向上扳为014方式,向下搬为EGA方式。  相似文献   

16.
图像上显现汉字的最简洁可行办法归纳如下:①在中文操作系统下输入所需要的汉字信息;②利用函数读取汉字信息,取汉字内码并转换为国际码的区号(内码高字节减AOH)和位号(内码低字节减AOH);③根据区号、位号计算该汉字在中文字库中的记录指针位置,利用数组读出其点阵信息;④由汉字库点阵排列规则用描点语句在屏幕指定位置逐点绘出汉字。  相似文献   

17.
单片机系统中的汉字显示   总被引:13,自引:2,他引:11  
需要显示的汉字较多时,单片机系统中的汉字编码非常繁琐。本文介绍一种直接利用PC机的汉字内码作为单片机系统的汉字编码,以简化系统的设计。  相似文献   

18.
本文给出了一种新型汉字内码结构, 它具有中西文兼容的处理功能,并且,保证不发生中西文混淆, 从而支持了汉字进入未作修改的西文软件。这种汉字内码已经在IBM PC/XT上的高兼容性汉字操作系统AC-DOS(Advanced Chinese Disk Operating System)上得到实现。在AC-DOS系统的支持下, 原西文系统支持的许多种软件如各种应用软件、各种编泽软件、行编辑、全屏幕编辑、数据库软件和计算机网络等, 不需作修改, 就能做到象处理西文一样处理汉字信息,同时, 仍保持西文的全部功能。  相似文献   

19.
多编码环境下藏字内码识别算法的研究   总被引:1,自引:0,他引:1  
藏字内码向ISO/IEC 10646-1藏文编码过渡是实现计算机用文字编码统一的必然趋势,但目前在很长的一段时间内仍将存在多种藏字编码并存的情况,所以实现藏字内码的自动识别是保证藏字多内码并存的关键.主要探讨了如何在多内码并存的多编码环境中实现藏字内码自动识别的问题,并提供了两个藏字内码识别算法.在此基础上,对不同的识别算法进行分析和评估.在对目标样本的测试中,以上算法的识别率最高可以达到100%以上.  相似文献   

20.
Magicwin236     
经常上网的朋友一定会发现很多主页由于采用了BIG5编码而不能浏览,而各种日文、韩文主页也无法正常观看。为了能查看上述网页,您必须拥有一套多内码中文平台。MagicWin 98就是不错的选择。MagicWin98共支持中文GB、BIG5、HZ编码,日文ShiftJIS、EUC、JIS编码,韩文KSC编码、UNICODE UTF7、UTF8编码,以及自动判断等12种内码。对于浏览主页来说,这么多种内码几乎可以满足所有的需要。启动MagicWIn 98后,一个浮动的窗口  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号