首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
计算机中各国文字编码的统一是必然趋势,而ISO/IEC10646正是顺应这种趋势而诞生的一个国际标准。现有的输入法绝大多数是基于本地代码页(ANSI CODE),存在着移植困难、不能跨语言平台以及向国际化标准过渡困难等缺点。本文首先分析了现有本地化输入法存在的问题,并在此基础上阐述了基于ISO10646的汉字输入法的实现方法,并给出了一个以ISO10646为核心的通用汉字输入法模型和原理,该模型由输入法管理/服务器、ISO10646输入码对照表、码本检索/过滤模块、输入法与OS接口模块、输入法内核和本地化接口六部分构成。最后,本文重点论述了输入法的核心—输入码对照表的设计和检索技术。  相似文献   

2.
熊丹  陆勤 《中文信息学报》2019,33(7):136-142
在ISO/IEC 10646国际编码标准中,香港使用的汉字载于H列。该文介绍了如何在ISO/IEC 10646国际编码标准下进一步完善香港电脑汉字的扩展机制及H列字符字源资料的编码方案。由于目前H列的很多字形并未完全反映香港的实际习惯写法,因此香港制定了一套适用于香港常用写法的电脑汉字参考字形,该文介绍了此套字形的原则。  相似文献   

3.
多文种环境下汉字内码识别算法的研究   总被引:9,自引:4,他引:9  
汉字内码向ISO/IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存的关键。本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题,并提供了多种汉字内码识别算法,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等。在此基础上,本文对不同的识别算法进行分析和评估。在对目标样本的测试中,以上算法的识别率最高可以达到99.9%以上。  相似文献   

4.
李春  杨梅 《软件世界》1996,(8):42-43
随着一款款优美的曲线字库的问世(如中文之星2.0+汉仪字库),中文WINDOWS平台的建立,彻底解决了DOS下中文平台字库重复开发的局面。WINDOWS 95中文版不仅支持大字符集,容纳子两万多个汉字,而且解决了简繁汉字同屏显示的难题,提供了符合国标的宋、黑、仿宋、楷体四款字库和10余种汉字输入法,使中文平台的应用水平,上升到一个新的档次。多媒体的兴起,使微机上图像处理日益频繁。做为  相似文献   

5.
随着ISO10646的出台,庞大的汉字词集的属性分析是一个迫切需要解决的难题,本文主要阐述了采用C/S模式的汉字词属性分析和重组系统的数据模型,并简单介绍了系统的设计要点。  相似文献   

6.
试论WINDOWS 3.1中文平台上汉字输入法的实现   总被引:5,自引:0,他引:5  
本文描述了WINDOWS中文平台上汉字输入的机制,简单介绍了两种典型WINDOWS中文平台上汉字输入法制作的要点,提出了在WINDOWS平台上实现汉字输入法所必须要考虑的新问题,为汉字输入法上一个新台阶提供了一条崭新的思路。  相似文献   

7.
在ICU中实现少数民族文字的处理   总被引:9,自引:7,他引:9  
基于ISO/IEC 10646和UNICODE国际标准,用传统的字体技术(如TrueType)来实现少数民族文字处理所面临的一个“瓶颈”问题是:“变形显现字符”不存在确定的码位。这也是多年来民文系统重复开发、互不兼容的根本原因。本文基于ICU的文字处理体系结构,阐述了完全支持Unicode标准的少数民族文字(本文主要指蒙古文字、维文、藏文等)的实现方法。文中首先介绍了少数民族文字的特点,分析其与拉丁文、汉字在计算机输入、输出过程中的不同之处,并指出少数民族文字处理的难点。其次介绍了一种能满足少数民族文字处理需求的字体技术——OpenType。最后,阐述了文字处理引擎的工作原理,以及ICU中如何实现对少数民族文字的支持。  相似文献   

8.
试论WINDOWS3.1中文平台上汉字输入法的实现   总被引:2,自引:0,他引:2  
本文描述了WINDOWS中文平台上汉字输入的机制,简单介绍了两种 典型WINDOWS中文平台上汉字输入法制作的要点,提出在WINDOWS平台上实现汉字输入法所必须要考虑的新问题,为汉字输入法上一个新台阶提供了一条崭新的思路。  相似文献   

9.
最近,一种新型的“键盘电脑设备”获国家专利。这是一种配合实施国际最新代码标准ISO/IEC-10646(GB-13000),统一处理中、日、韩三国所使用的数万个不同的汉字的整字输入而研制的硬件新产品。 “键盘电脑设备”由PC系列机的主机板和一种特殊键盘电路  相似文献   

10.
基于汉字发生器的汉字字形CAD系统的设计   总被引:1,自引:1,他引:0  
本文提出一种基于汉字发生器的汉字字形计算机辅助设计系统的设计方案,系统功能上分为设计笔划形体和快速造字两部分, 在设定了笔划形体之后, 就能方便快速制造该字体的全字号、全字集的汉字。在ISO 10646 CJK 大字库的开发中, 初步得到验证, 综合性能高, 具有现实意义。  相似文献   

11.
一、概论 到目前为止,计算机代码处理体制是以传统的ASCll或者EBCDIC为基础的。采八位编码,最多只能表示256个不同的字符,要处理所使用字符超过256个的非英语语种,特别亚洲语系的语言,许  相似文献   

12.
基于ISO10646的开放系统的设计与实现   总被引:1,自引:0,他引:1  
李文峰  吴健 《计算机学报》1995,18(10):744-754
ISO 10646标准的提出是开放系统发展的一个里程碑。CJK大字符集也经过中、日、韩三方专家的共同努力而成为第一个为国际准化组织认可的中文标准。中科院软件所经过近一年的攻关,终于在开放系统上实现了ISO 10646及其CJK标准。本文首先对ISO10646及CJK作了简要介绍,然后描述了系统的总体结构及编码方案,并详细地讨论了中文本地特征数据库、中文输入方法服务器、字型集合、ICONV子系统的设  相似文献   

13.
基于ISO/IEC10646标准的藏文操作系统若干问题研究   总被引:3,自引:3,他引:3  
长期以来尚未有完整的藏文操作系统,原因是藏文文字的特性要求特定的文字处理。本文基于ISOPIEC 10646 的藏文字符集标准,结合藏文正字法要求,详细分析了藏文操作系统实现中的关键问题: (1) 藏文字符集方案比较与藏文存储; (2) 藏文输入; (3) 藏文显现。藏文显现是公认的“瓶颈”问题。对此,本文提出基于音节划分、使用OpenType 字体及相应的文本引擎来解决藏文“叠加”字符的显现。此方案应用于Qt 库的实验及相关测试证明基于ISOPIEC 10646 标准的藏文操作系统实现是较合理的方案。  相似文献   

14.
随着ISO10646的出台,庞大的汉字词集的属性分析是一个迫切需要解决的难题,本文主要阐述了采用C/S模式的汉字词属性分析和重组系统的数据模型,并简单介绍了系统的设计要点。  相似文献   

15.
陈壮 《中文信息学报》2007,21(4):122-128
标准化是实现技术产业化的基础。中文信息处理技术是我国特有的、具有国际领先水平的技术。我国自 20 世纪80 年代参与ISO/ IEC J TC1/ SC2 的活动以来,在中文编码技术的国际标准化工作中取得了显著成绩。本文介绍了ISO/ IEC J TC1/ SC2 的工作领域、工作方式和组织结构;我国参与ISO/ IEC J TC1/ SC2 及其下属该组织活动的方式;国际标准ISO/ IEC 10646 的大致情况和我国在参与此国际标准研制工作中取得的成绩、当前的工作和未来工作的计划。本文论述了我国参与本文ISO/ IEC J TC1/ SC2 活动的意义,以及我国在ISO/ IEC J TC1/ SC2 活动中的作用、地位和影响。作者还提出了对未来工作的建议。  相似文献   

16.
Pei‐Chi Wu 《Software》2002,32(1):73-82
ISO 10646 Universal Character Set (UCS) or Unicode covers symbols in most of the World's written languages. There are various UCS transformation formats (UTF). UTF‐8 is compatible with systems that assume 8‐bit characters. One of the problems with UTF‐8 is its space efficiency. For files containing most Asian characters such as Han ideographs, the file sizes increase by about 50% by using UTF‐8. Although the Standard Compression Scheme for Unicode (SCSU) can compress Unicode strings to the size of a locale‐specific character set, it is complicated and is not intended to serve as a general purpose interchange format. This paper proposes a page‐shift transformation format of ISO 10646, called UTF‐S. There are four pages: 1‐byte, 2‐byte, 3‐byte and 4‐byte. Shift to page 0 uses a special code ; shift to page 1, 2, and 3 uses ISO 2022 shift codes SO, SS2, and SS3, respectively. We test several text files and compare these UTF with Big5, a locale‐specific character set. The result shows that the space efficiency of UTF‐S is better than that of UTF‐16 and UTF‐8 and is close to that of SCSU. UTF‐S is suitable for replacing locale‐specific character sets with ISO 10646 in Internet applications, such as the World Wide Web. Copyright © 2001 John Wiley & Sons, Ltd.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号